Automatización de Procesos Empresariales mediante Inteligencia Artificial en Foreworth

Albert Rodríguez de Miguel, Hugo

dc.contributor.advisor	Marinetto Sánchez, Álvaro	es-ES
dc.contributor.author	Albert Rodríguez de Miguel, Hugo	es-ES
dc.contributor.other	Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)	es_ES
dc.date.accessioned	2025-11-09T17:39:45Z
dc.date.available	2025-11-09T17:39:45Z
dc.date.issued	2026	es_ES
dc.identifier.uri	http://hdl.handle.net/11531/107011
dc.description	Grado en Ingeniería Matemática e Inteligencia Artificial	es_ES
dc.description.abstract	Este trabajo aborda la automatización de dos procesos analíticos en Foreworth, una plataforma de inteligencia de software que analiza datos de repositorios Git para generar métricas de productividad y informes sobre el rendimiento de los desarrolladores. El primer proceso trata el mapeo de identidades de desarrollador. Un mismo desarrollador puede contribuir a los repositorios bajo múltiples identidades en Git, distintas direcciones de correo, nombres de usuario o convenciones de nomenclatura, que, si no se resuelven correctamente, distorsionan directamente las métricas de productividad. El sistema existente automatizaba parcialmente esta tarea pero seguía requiriendo una validación manual considerable. Este trabajo mejora el enfoque original ampliando las comparaciones de similitud Jaro-Winkler entre campos de nombre y alias en ambas direcciones, introduciendo normalización de nombres, detección de cuentas no humanas y un umbral dinámico que se adapta a la longitud de las cadenas. Junto al enfoque heurístico, se entrenaron y evaluaron modelos supervisados como Random Forest, XGBoost y LightGBM, así como redes Siamesas con capas LSTM. Random Forest obtuvo el mejor equilibrio entre precisión y recall dentro de los modelos supervisados, pero el enfoque heurístico mejorado fue seleccionado para producción por su mayor precisión en tenants no vistos, su menor complejidad operativa y la ausencia de requisitos de reentrenamiento. El sistema redujo el esfuerzo de validación manual durante la incorporación de nuevos clientes aproximadamente un 75%. El segundo proceso trata la generación automatizada de informes. Los consultores de Foreworth producían manualmente informes de rendimiento individual, un proceso que no escalaba bien con el crecimiento del número de clientes. Este trabajo introduce un pipeline modular en dos etapas construido sobre Amazon Bedrock: los datos estructurados se resumen primero por dimensión mediante prompts dedicados y después se consolidan en un informe final mediante una segunda llamada al modelo. El sistema genera cinco tipos de informe. En la iteración final, los consultores no pudieron distinguir de forma consistente entre informes generados automáticamente e informes escritos manualmente. El tiempo de producción pasó de una media estimada de 45 minutos a menos de dos. Ambos procesos demuestran que una automatización fiable y mantenible puede generar un valor operativo significativo sin necesidad de recurrir a las soluciones más complejas disponibles.	es-ES
dc.description.abstract	This project addresses the automation of two analytical processes at Foreworth, a software intelligence platform that analyses Git repository data to generate developer productivity metrics and reports. The first process concerns developer identity mapping. A single developer may contribute to repositories under multiple Git identities, different email addresses, usernames, or naming conventions, which, if left unresolved, directly distorts productivity metrics. The existing system partially automated this task but still required significant manual validation. This project improves the original approach by extending Jaro-Winkler similarity comparisons across name and alias fields in both directions, introducing name normalisation, bot detection, and a dynamic threshold that adapts to string length. Alongside the heuristic, supervised models including Random Forest, XGBoost, and LightGBM were trained and evaluated, as well as Siamese LSTM networks. Random Forest achieved the best balance among supervised approaches, but the enhanced heuristic was selected for production due to its higher precision on unseen tenants, lower operational complexity, and absence of retraining requirements. The system reduced manual mapping effort during client onboarding by approximately 75%. The second process concerns automated report generation. Foreworth consultants previously produced developer performance reports manually, a process that did not scale well across large client tenants. This project introduces a modular two-stage pipeline built on Amazon Bedrock: structured data is first summarised per dimension using dedicated prompts, then consolidated into a final report by a second LLM call. The system generates five report types covering commit activity, code quality, work routines, individual performance, and low-productivity cases. By the final iteration, consultants could not consistently distinguish automatically generated reports from manually written ones. Report production time fell from an estimated 45 minutes to under two minutes. Both processes demonstrate that reliable, maintainable automation can deliver significant operational value without necessarily requiring the most complex available solution.	en-GB
dc.format.mimetype	application/pdf	es_ES
dc.language.iso	es-ES	es_ES
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 United States	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	es_ES
dc.subject.other	KMI	es_ES
dc.title	Automatización de Procesos Empresariales mediante Inteligencia Artificial en Foreworth	es_ES
dc.type	info:eu-repo/semantics/bachelorThesis	es_ES
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es_ES
dc.keywords	Jaro-Winkler, Random Forest, LLM, prompt engineering, identidad de desarrollador, generación de informes	es-ES
dc.keywords	Jaro-Winkler, Random Forest, LLM, prompt engineering, developer identity, report generation	en-GB

Ficheros en el ítem

Nombre:: TFG_Hugo_Albert.pdf
Tamaño:: 1.006Mb
Formato:: PDF
Descripción:: Trabajo Fin de Grado

Ver/

Nombre:: Anexo I.pdf
Tamaño:: 128.2Kb
Formato:: PDF
Descripción:: Autorización

Ver/

Este ítem aparece en la(s) siguiente(s) colección(ones)

TFG, TFM (temporales)

Mostrar el registro sencillo del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivs 3.0 United States