Leading Indicator del Sector Bancario en Estados Unidos - Andreu Matas, Pablo
Abstract
Este trabajo presenta un modelo de regresión logística para predecir la probabilidad de
que un banco estadounidense caiga en insolvencia. Se analiza la información de 48
bancos entre 2018 y 2023, incluyendo 11 que entraron en default, 5 de ellos en 2023.
Para desarrollar el modelo, se seleccionaron 15 ratios financieros y 2 variables externas
(tipos de interés y quantitative easing) como variables independientes. Se utilizó un
análisis de componentes principales o PCA para reducir la dimensionalidad del
conjunto de datos y se construyó el modelo de regresión logística con las variables
relevantes. El modelo tiene una alta capacidad predictiva, con un AUC de 0.944. Las
variables que más afectan a la probabilidad de default son: Return on Average Assets,
Net Charge-Offs / Average Loans, Common Equity Tier 1 Capital Ratio, Tangible
Common Equity / Tangible Assets, Interest Rate y Quantitative Easing. El modelo
identifica correctamente 7 de los 9 bancos que entraron en default en 2023.
A partir de los resultados, se identifican dos bancos que podrían estar en riesgo de
default: US Bancorp y Columbia Bank. Se recomienda actualizar el modelo con datos
nuevos y utilizarlo junto con otras herramientas de análisis para una mejor toma de
decisiones.
Es importante mencionar las limitaciones del estudio, como la disponibilidad de datos y
la generalización del modelo a otros países o contextos económicos. Se recomienda
ampliar la base de datos con información de más bancos y variables, e implementar el
modelo como un leading indicator para la identificación de bancos en riesgo. This work presents a logistic regression model to predict the probability of a US bank defaulting. The information of 48 banks between 2018 and 2023 is analyzed, including 11 that went into default, 5 of them in 2023.
To develop the model, 15 financial ratios and 2 external variables (interest rates and quantitative easing) were selected as independent variables. A Principal Component Analysis (PCA) was used to reduce the dimensionality of the dataset and the logistic regression model was built with the relevant variables.
The model has a high predictive capacity, with an AUC of 0.944. The variables that most affect the probability of default are: Return on Average Assets, Net Charge-Offs / Average Loans, Common Equity Tier 1 Capital Ratio, Tangible Common Equity / Tangible Assets, Interest Rate, and Quantitative Easing. The model correctly identifies 7 out of the 9 banks that went into default in 2023.
Based on the results, two banks are identified as potentially at risk of default: US Bancorp and Columbia Bank. It is recommended to update the model with new data and use it together with other analysis tools for better decision-making.
It is important to mention the limitations of the study, such as data availability and the generalizability of the model to other countries or economic contexts. It is recommended to expand the database with information from more banks and variables and implement the model as a leading indicator for identifying banks at risk.
Trabajo Fin de Grado
Leading Indicator del Sector Bancario en Estados Unidos - Andreu Matas, PabloTitulación / Programa
Grado en Administración y Dirección de Empresas y Grado en Análisis de Negocios/Business AnalyticsMaterias/ categorías / ODS
K2NPalabras Clave
insolvencia bancaria, regresión logística, ratios financierosdefault