| dc.contributor.advisor | Jiménez Arocha, Andrés | es-ES |
| dc.contributor.author | Arroyo García, Javier | es-ES |
| dc.contributor.other | Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI) | es_ES |
| dc.date.accessioned | 2026-06-15T09:12:08Z | |
| dc.date.available | 2026-06-15T09:12:08Z | |
| dc.date.issued | 2026 | es_ES |
| dc.identifier.uri | http://hdl.handle.net/11531/110749 | |
| dc.description | Máster Universitario en Big Data | es_ES |
| dc.description.abstract | El correo electrónico continúa siendo uno de los principales canales de
entrada de información en las grandes organizaciones del sector asegurador,
donde la gestión manual de altos volúmenes de mensajes con adjuntos
heterogéneos representa un cuello de botella operativo significativo. El
presente Trabajo de Fin de Máster aborda el diseño e implementación de una
solución end-to-end para la gestión automatizada de buzones corporativos
basada en Large Language Models (LLMs), desplegada sobre una arquitectura
serverless en AWS dentro del entorno corporativo de MAPFRE.
El sistema implementa un pipeline desacoplado de funciones Lambda
especializadas que cubre la ingesta de correos, la extracción y
procesamiento de adjuntos mediante una estrategia híbrida que combina
técnicas clásicas de OCR con las capacidades multimodales del modelo, la
clasificación documental contra un catálogo definido por negocio, la
extracción del número de referencia del siniestro y el reenvío al sistema
transaccional. La adaptación del modelo se ha resuelto íntegramente mediante
prompt engineering iterativo, evitando el coste y la rigidez del fine-tuning
y permitiendo ajustar el comportamiento del sistema en ciclos cortos de
validación conjunta con el equipo de tramitadores. El diseño contempla la
generalización a nuevos buzones corporativos mediante un loader pattern,
mecanismos de resiliencia que garantizan la no pérdida de información, un
plan de contingencia para escenarios de fallo total del servicio, y
monitorización en dos capas --- técnica mediante Amazon CloudWatch y
funcional mediante dashboards en Power BI.
La evaluación del sistema sobre batches reales de correos del buzón piloto
evidencia una mejora sustancial frente a la solución basada en NLP clásico
que se sustituye, validando tanto la viabilidad técnica como el potencial
impacto operativo de la aproximación propuesta. | es-ES |
| dc.description.abstract | Email remains one of the primary channels through which information enters
large organizations in the insurance sector, where the manual handling of
high volumes of messages with heterogeneous attachments represents a
significant operational bottleneck. This Master's Thesis addresses the
design and implementation of an end-to-end solution for the automated
management of corporate mailboxes based on Large Language Models (LLMs),
deployed on a serverless architecture on AWS within MAPFRE's corporate
environment.
The system implements a decoupled pipeline of specialized Lambda functions
covering email ingestion, the extraction and processing of attachments
through a hybrid strategy that combines classical OCR techniques with the
multimodal capabilities of the model, document classification against a
business-defined catalogue, the extraction of the claim reference number,
and forwarding to the transactional system. Model adaptation has been
resolved entirely through iterative prompt engineering, avoiding the cost
and rigidity of fine-tuning and allowing the system's behaviour to be
adjusted in short cycles of joint validation with the claims-handling team.
The design considers generalization to new corporate mailboxes through a
loader pattern, resilience mechanisms that guarantee no loss of
information, a contingency plan for total service failure scenarios, and
two-layer monitoring --- technical through Amazon CloudWatch and functional
through Power BI dashboards.
The evaluation of the system on real batches of emails from the pilot
mailbox shows a substantial improvement over the classical NLP-based
solution it replaces, validating both the technical feasibility and the
potential operational impact of the proposed approach. | en-GB |
| dc.format.mimetype | application/pdf | es_ES |
| dc.language.iso | es-ES | es_ES |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 United States | es_ES |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | es_ES |
| dc.subject.other | H0Z | es_ES |
| dc.title | LLM-Based Email Management | es_ES |
| dc.type | info:eu-repo/semantics/masterThesis | es_ES |
| dc.rights.accessRights | info:eu-repo/semantics/openAccess | es_ES |
| dc.keywords | Email management, clasificación automática, arquitectura serverless, modelos de lenguaje (LLM), automatización de procesos | es-ES |
| dc.keywords | Email management, automatic classification, serverless architecture, large language models (LLM), process automation | en-GB |