Mostrar el registro sencillo del ítem
Automatización de Procesos Empresariales mediante Inteligencia Artificial en Foreworth
| dc.contributor.advisor | Marinetto Sánchez, Álvaro | es-ES |
| dc.contributor.author | Albert Rodríguez de Miguel, Hugo | es-ES |
| dc.contributor.other | Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI) | es_ES |
| dc.date.accessioned | 2025-11-09T17:39:45Z | |
| dc.date.available | 2025-11-09T17:39:45Z | |
| dc.date.issued | 2026 | es_ES |
| dc.identifier.uri | http://hdl.handle.net/11531/107011 | |
| dc.description | Grado en Ingeniería Matemática e Inteligencia Artificial | es_ES |
| dc.description.abstract | Este trabajo aborda la automatización de dos procesos analíticos en Foreworth, una plataforma de inteligencia de software que analiza datos de repositorios Git para generar métricas de productividad y informes sobre el rendimiento de los desarrolladores. El primer proceso trata el mapeo de identidades de desarrollador. Un mismo desarrollador puede contribuir a los repositorios bajo múltiples identidades en Git, distintas direcciones de correo, nombres de usuario o convenciones de nomenclatura, que, si no se resuelven correctamente, distorsionan directamente las métricas de productividad. El sistema existente automatizaba parcialmente esta tarea pero seguía requiriendo una validación manual considerable. Este trabajo mejora el enfoque original ampliando las comparaciones de similitud Jaro-Winkler entre campos de nombre y alias en ambas direcciones, introduciendo normalización de nombres, detección de cuentas no humanas y un umbral dinámico que se adapta a la longitud de las cadenas. Junto al enfoque heurístico, se entrenaron y evaluaron modelos supervisados como Random Forest, XGBoost y LightGBM, así como redes Siamesas con capas LSTM. Random Forest obtuvo el mejor equilibrio entre precisión y recall dentro de los modelos supervisados, pero el enfoque heurístico mejorado fue seleccionado para producción por su mayor precisión en tenants no vistos, su menor complejidad operativa y la ausencia de requisitos de reentrenamiento. El sistema redujo el esfuerzo de validación manual durante la incorporación de nuevos clientes aproximadamente un 75%. El segundo proceso trata la generación automatizada de informes. Los consultores de Foreworth producían manualmente informes de rendimiento individual, un proceso que no escalaba bien con el crecimiento del número de clientes. Este trabajo introduce un pipeline modular en dos etapas construido sobre Amazon Bedrock: los datos estructurados se resumen primero por dimensión mediante prompts dedicados y después se consolidan en un informe final mediante una segunda llamada al modelo. El sistema genera cinco tipos de informe. En la iteración final, los consultores no pudieron distinguir de forma consistente entre informes generados automáticamente e informes escritos manualmente. El tiempo de producción pasó de una media estimada de 45 minutos a menos de dos. Ambos procesos demuestran que una automatización fiable y mantenible puede generar un valor operativo significativo sin necesidad de recurrir a las soluciones más complejas disponibles. | es-ES |
| dc.description.abstract | This project addresses the automation of two analytical processes at Foreworth, a software intelligence platform that analyses Git repository data to generate developer productivity metrics and reports. The first process concerns developer identity mapping. A single developer may contribute to repositories under multiple Git identities, different email addresses, usernames, or naming conventions, which, if left unresolved, directly distorts productivity metrics. The existing system partially automated this task but still required significant manual validation. This project improves the original approach by extending Jaro-Winkler similarity comparisons across name and alias fields in both directions, introducing name normalisation, bot detection, and a dynamic threshold that adapts to string length. Alongside the heuristic, supervised models including Random Forest, XGBoost, and LightGBM were trained and evaluated, as well as Siamese LSTM networks. Random Forest achieved the best balance among supervised approaches, but the enhanced heuristic was selected for production due to its higher precision on unseen tenants, lower operational complexity, and absence of retraining requirements. The system reduced manual mapping effort during client onboarding by approximately 75%. The second process concerns automated report generation. Foreworth consultants previously produced developer performance reports manually, a process that did not scale well across large client tenants. This project introduces a modular two-stage pipeline built on Amazon Bedrock: structured data is first summarised per dimension using dedicated prompts, then consolidated into a final report by a second LLM call. The system generates five report types covering commit activity, code quality, work routines, individual performance, and low-productivity cases. By the final iteration, consultants could not consistently distinguish automatically generated reports from manually written ones. Report production time fell from an estimated 45 minutes to under two minutes. Both processes demonstrate that reliable, maintainable automation can deliver significant operational value without necessarily requiring the most complex available solution. | en-GB |
| dc.format.mimetype | application/pdf | es_ES |
| dc.language.iso | es-ES | es_ES |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 United States | es_ES |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | es_ES |
| dc.subject.other | KMI | es_ES |
| dc.title | Automatización de Procesos Empresariales mediante Inteligencia Artificial en Foreworth | es_ES |
| dc.type | info:eu-repo/semantics/bachelorThesis | es_ES |
| dc.rights.accessRights | info:eu-repo/semantics/openAccess | es_ES |
| dc.keywords | Jaro-Winkler, Random Forest, LLM, prompt engineering, identidad de desarrollador, generación de informes | es-ES |
| dc.keywords | Jaro-Winkler, Random Forest, LLM, prompt engineering, developer identity, report generation | en-GB |

