DOCUMENT INTELLIGENCE: UNIVERSAL DOCUMENT ANALYSIS
Abstract
Esta tesis presenta una plataforma modular basada en esquemas para la inteligencia
documental, capaz de procesar cualquier tipo de documento sin depender de plantillas ni
modelos predefinidos. Combina motores OCR, modelos de lenguaje (LLMs) y flujos de
trabajo ajustados para permitir una clasificación precisa y una extracción estructurada de
datos a nivel de campo, adaptándose a múltiples formatos y casos de uso. Gracias a su
infraestructura nativa en la nube, el sistema permite un procesamiento documental escalable,
rentable y explicable en entornos empresariales reales. Los casos de uso incluyen ámbitos
legales, gestión de multas de tráfico y plataformas internas, validando su precisión,
adaptabilidad y preparación para entornos de producción. This thesis presents a modular, schema-based platform for Document Intelligence—capable
of processing any document type without relying on templates or predefined models. It
combines OCR engines, LLMs, and fine-tuned pipelines to enable accurate classification
and field-level data extraction across diverse formats and use cases. Backed by cloud-native
infrastructure, the system achieves scalable, cost-effective, and explainable document
processing in real-world enterprise deployments. Use cases include legal, traffic, and low
code environments, validating the tool’s accuracy, adaptability, and production readiness.
Trabajo Fin de Máster
DOCUMENT INTELLIGENCE: UNIVERSAL DOCUMENT ANALYSISTitulación / Programa
Máster Universitario en Big DataMaterias/ categorías / ODS
H0ZPalabras Clave
Inteligencia Documental, IA empresarial, LLMsDocument Intelligence, Enterprise AI, LLMs