Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/11531/101086Registro completo de metadatos
| Campo DC | Valor | Lengua/Idioma |
|---|---|---|
| dc.contributor.advisor | Rodríguez Gallego, Alejandro | es-ES |
| dc.contributor.author | Muñoz Navarro, Gonzalo | es-ES |
| dc.contributor.other | Universidad Pontificia Comillas, Facultad de Ciencias Económicas y Empresariales | es_ES |
| dc.date.accessioned | 2025-07-15T12:16:17Z | - |
| dc.date.available | 2025-07-15T12:16:17Z | - |
| dc.date.issued | 2026 | es_ES |
| dc.identifier.uri | http://hdl.handle.net/11531/101086 | - |
| dc.description | Grado en Administración y Dirección de Empresas y Grado en Análisis de Negocios/Business Analytics | es_ES |
| dc.description.abstract | Este Trabajo de Fin de Grado desarrolla una prueba de concepto para predecir la terminación de contratos de arrendamiento de emplazamientos de telecomunicaciones (el suelo sobre el que se asientan torres y antenas). A partir de un conjunto de 11.501 eventos contractuales correspondientes a 4.233 emplazamientos y 4.806 contratos, se construye un pipeline completo de modelización: análisis exploratorio, codificación de variables, un modelo lineal explicativo (regresión logística) y un modelo predictivo basado en gradient boosting (XGBoost). El objetivo es identificar los contratos que el propietario rescinde unilateralmente, un evento poco frecuente (6,3 % de los casos) y de alto impacto económico para la compañía. Más allá de obtener un modelo con buen poder discriminante, el trabajo pone el énfasis en la honestidad metodológica: se audita el modelo frente a la fuga de información (data leakage) y al sobreajuste, y se demuestra que la validación aleatoria habitual sobrestima el rendimiento en un problema con fuerte componente temporal. Al validar el modelo de forma realista —entrenando con el pasado y evaluando con el futuro— el rendimiento desciende desde un AUC de 0,97 hasta valores en torno a 0,87 de ROC-AUC y 0,53 de PR-AUC, que constituyen la cifra honesta y mantienen al modelo del orden de seis a siete veces por encima de la tasa base de eventos. El trabajo itera el modelo (versiones v1, v2 y v3) hasta una versión depurada, más robusta y defendible, y discute las limitaciones de los datos, en particular la fuerte no estacionariedad de la tasa de terminación y la disponibilidad desigual de la información de incidencias a lo largo del tiempo. | es-ES |
| dc.description.abstract | This Final Degree Project develops a proof of concept to predict the termination of lease agreements for telecommunications sites (the land on which towers and antennas are situated). Using a dataset of 11,501 contractual events corresponding to 4,233 sites and 4,806 contracts, a complete modelling pipeline is constructed: exploratory analysis, variable encoding, an explanatory linear model (logistic regression) and a predictive model based on gradient boosting (XGBoost). The aim is to identify contracts that are unilaterally terminated by the landowner, a rare event (6.3 per cent of cases) with a significant financial impact on the company. Beyond obtaining a model with good discriminatory power, the work emphasises methodological rigour: the model is audited for data leakage and overfitting, and it is demonstrated that standard random validation overestimates performance in a problem with a strong temporal component. When the model is validated realistically—by training on past data and evaluating against future data—performance drops from an AUC of 0.97 to values of around 0.87 for ROC-AUC and 0.53 for PR-AUC; these figures represent an honest assessment and still keep the model performing six to seven times better than the baseline event rate. The study iterates on the model (versions v1, v2 and v3) until a refined, more robust and defensible version is achieved, and discusses the limitations of the data, in particular the strong non-stationarity of the termination rate and the uneven availability of incident information over time. | en-GB |
| dc.format.mimetype | application/pdf | es_ES |
| dc.language.iso | en-GB | es_ES |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 United States | es_ES |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | es_ES |
| dc.subject.other | KBA | es_ES |
| dc.title | TFG BA - Comillas Emprende | es_ES |
| dc.type | info:eu-repo/semantics/bachelorThesis | es_ES |
| dc.rights.accessRights | info:eu-repo/semantics/openAccess | es_ES |
| dc.keywords | churn, XGBoost, regresión logística, desbalanceo de clases, fuga de información, validación temporal, no estacionariedad, towerco. | es-ES |
| dc.keywords | churn, XGBoost, logistic regression, class imbalance, information leakage, temporal validation, non-stationarity, towerco. | en-GB |
| Aparece en las colecciones: | TFG, TFM (temporales) | |
Ficheros en este ítem:
| Fichero | Tamaño | Formato | |
|---|---|---|---|
| TFG.Analytics.GonzaloMunozNavarro.pdf | 991,5 kB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.