Estudio del riesgo de crédito y su marco normativo para la predicción de la probabilidad de default empleando técnicas de machine learning
Abstract
Este proyecto realiza un estudio del riesgo de crédito y de los factores que lo constituyen,
tratando de sentar las bases teóricas del trabajo. A continuación, se desarrolla el panorama
regulativo histórico y actual. Centrándonos en la normativa europea, se exponen los
marcos normativos planteados por el comité de Basilea, concretamente Basilea I y Basilea
II. Dentro de este último, se profundiza en los métodos basados en calificaciones internas
(IRB). Se concluye el apartado teórico con la decisión de seleccionar la metodología IRB
básica para la predicción de la probabilidad de default mediante el uso de modelos
estadísticos y analíticos propios.
Los modelos seleccionados son un modelo de regresión logística, un modelo de red
neuronal, un modelo de árbol de decisión y un modelo basado en XGBoost. Estos
modelos son entrenados empleando los datos del banco especializado en préstamos entre
particulares Lending Club. Primero, se lleva a cabo un tratamiento de los datos, donde
reducimos el número de variables a emplear de 151 a 76. Posteriormente, se desarrollan
y entrenan los cuatro modelos, cuyo desempeño demuestra una excelente capacidad
predictiva. This project conducts a study of credit risk and the factors that constitute it, trying to lay
the theoretical foundations of the work. Next, the historical and current regulatory
panorama is developed. Focusing on European regulations, the regulatory frameworks
proposed by the Basel Committee, specifically Basel I and Basel II, are presented.
Within the latter, the internal ratings-based approach (IRB) is discussed in depth. The
theoretical section concludes with the decision to select the basic IRB methodology for
the prediction of the probability of default through the use of statistical and analytical
models.
The selected models are a logistic regression model, a neural network model, a decision
tree model and a model based on XGBoost. These models are trained using data from
the private lending bank Lending Club. First, a data treatment is carried out, where we
reduce the number of variables to be used from 151 to 76. Subsequently, the four
models are developed and trained, and their performance shows an excellent predictive
capacity.
Trabajo Fin de Grado
Estudio del riesgo de crédito y su marco normativo para la predicción de la probabilidad de default empleando técnicas de machine learningTitulación / Programa
Grado en Ingeniería en Tecnologías de Telecomunicación y Grado en Análisis de Negocios/Business AnalyticsMaterias/ UNESCO
53 Ciencias económicas5307 Teoría económica
530702 Teoría del crédito
Materias/ categorías / ODS
KBAPalabras Clave
Riesgo de crédito, Basilea, IRB, Probabilidad de default, Machine learning, Regresión logística, Redes neuronales, Árboles de decisión, XGBoostCredit risk, Basel, IRB, Probability of default, Machine learning, Logistic regression, Neural networks, Decision trees, XGBoost