Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/110091
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorRuiz Espinar, Gonzaloes-ES
dc.contributor.authorGonzález Parejo, Juliaes-ES
dc.contributor.otherUniversidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)es_ES
dc.date.accessioned2026-05-15T15:57:24Z-
dc.date.available2026-05-15T15:57:24Z-
dc.date.issued2026es_ES
dc.identifier.urihttp://hdl.handle.net/11531/110091-
dc.descriptionMáster Universitario en Big Dataes_ES
dc.description.abstractCuando un banco concede un préstamo asume el riesgo de que el prestatario no lo devuelva. Si esto ocurre, debe estimar cuánto recuperará finalmente mediante la liquidación de colateral u otros mecanismos. La fracción de la deuda no recuperada se conoce como Loss Given Default (LGD), uno de los parámetros que la regulación bancaria exige estimar con precisión. Estimar bien la LGD no es sencillo: el proceso de recuperación puede durar años, y en cualquier momento una parte de los préstamos en mora aún no ha llegado a su resolución final. Los modelos tradicionales descartan estas observaciones o proyectan sus recuperaciones futuras, introduciendo incertidumbre adicional. Este trabajo propone aplicar el análisis de supervivencia, técnica habitualmente empleada en medicina y diseñada para trabajar con observaciones incompletas, a la estimación de la LGD hipotecaria. El estudio se desarrolla sobre una muestra del Single-Family Loan-Level Dataset de Freddie Mac, con hipotecas residenciales originadas entre 2005 y 2025. Tras la depuración de los datos, se trabaja con 28.502 episodios de default. La LGD se construye a partir de los flujos de caja observados, descontados al tipo de interés del propio préstamo. Sobre esta muestra se comparan dos modelos de supervivencia: el modelo de riesgos proporcionales de Cox, y el Random Survival Forest, basado en aprendizaje automático. El objetivo es estudiar si estas técnicas ofrecen una forma útil de tratar procesos de recuperación largos y observaciones censuradas, evaluando ambos modelos mediante métricas de discriminación y calibración. Los resultados muestran que el enfoque de supervivencia incorpora los episodios censurados y ofrece predicciones competitivas frente a un modelo lineal de referencia, especialmente con el RSF. Además, se propone una extensión dinámica para actualizar la pérdida esperada de préstamos en mora.es-ES
dc.description.abstractWhen a bank grants a loan, it assumes the risk that the borrower will fail to repay it. If this happens, the bank must estimate how much it will ultimately recover through collateral liquidation or other mechanisms. The fraction of the debt that is not recovered is known as Loss Given Default (LGD), one of the parameters that banking regulation requires to be estimated with precision. Estimating LGD accurately is not straightforward: the recovery process can take years, and at any given point in time a portion of defaulted loans have not yet reached final resolution. Traditional models either discard these observations or project their future recoveries, introducing additional uncertainty. This work proposes applying survival analysis, a technique commonly used in medicine and designed to handle incomplete observations, to the estimation of mortgage LGD. The study is conducted on a sample from Freddie Mac's Single-Family Loan-Level Dataset, covering residential mortgages originated between 2005 and 2025. After data cleaning, 28,502 default episodes are analyzed. LGD is constructed from observed cash flows, discounted at the loan's own interest rate. Two survival analysis models are compared: the Cox proportional hazards model, and the Random Survival Forest, based on machine learning. The aim is to study whether these techniques offer a useful way of handling long recovery processes and censored observations, evaluating both models through discrimination and calibration metrics. Results show that the survival approach successfully incorporates censored episodes and yields competitive predictions compared to a linear benchmark model, especially in the case of the RSF. In addition, a dynamic extension is proposed to update the expected loss of loans that are already in default.en-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoes-ESes_ES
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United Stateses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/es_ES
dc.subject.otherH0Zes_ES
dc.titleIntegración de técnicas de Machine Learning en el Análisis de Supervivencia para la optimización de la LGD.es_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.keywordsLoss Given Default (LGD), Análisis de supervivencia, datos censurados, riesgo de crédito, random survival forestses-ES
dc.keywordsLoss Given Default (LGD), Survival Analysis, censored data, credit risk, random survival forestsen-GB
Aparece en las colecciones: TFG, TFM (temporales)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Memoria Julia - firmado.pdfTrabajo Fin de Máster984,03 kBAdobe PDFVisualizar/Abrir
AnexoI_Autoria - firmado.pdfAutorización88,29 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.