Predicting M&A targets in the U.S. tech industry using ALBERT, FinBERT and Longformer models
Abstract
En los últimos años, el volumen de Fusiones y Adquisiciones ha aumentado significativamente, generando un interés creciente en predecir estas transacciones debido a su potencial rentabilidad para los inversores, atribuida a la prima pagada por el adquirente. Este estudio investiga el uso de Transformadores de Procesamiento de Lenguaje Natural para predecir posibles objetivos de F&A en el sector tecnológico de EE.UU. mediante el análisis de datos textuales de los informes 10-K de las empresas, específicamente en las secciones de Discusión y Análisis de la Gestión.
Los modelos de predicción tradicionales suelen basarse en métricas financieras; sin embargo, esta investigación explora el potencial de integrar información textual para mejorar la precisión de las predicciones. Utilizando modelos de aprendizaje profundo como ALBERT, FinBERT y Longformer, el estudio encuentra que la combinación de datos textuales y financieros mejora el rendimiento del modelo. Entre estos modelos, FinBERT, entrenado en textos financieros, demuestra la mayor precisión. A pesar de estos resultados prometedores, el pequeño y desequilibrado conjunto de datos del estudio limita la generalización de los hallazgos.
Por lo tanto, la investigación futura debería centrarse en expandir el conjunto de datos e incorporar variables financieras y textuales adicionales para refinar el análisis In recent years, the volume of Mergers and Acquisitions (“M&A”) has increased significantly, driving heightened interest in predicting these transactions due to their potential profitability for investors, attributed to the premium paid by the acquirer. This study investigates the use of Natural Language Processing (“NLP”) Transformers to predict potential M&A targets within the U.S. technology sector by analyzing textual data from companies' 10-K filings, specifically the Management Discussion and Analysis (“MD&A”) sections.
Traditional prediction models often rely on financial metrics. However, this research explores the potential of integrating textual information to improve prediction accuracy. Utilizing deep learning models such as ALBERT, FinBERT, and Longformer, the study finds that combining textual and financial data enhances model performance. Among these models, FinBERT, which is trained in financial texts, demonstrates the highest accuracy. Despite these promising results, the study's small and imbalanced dataset limits the generalizability of the findings.
Therefore, future research should focus on expanding the dataset and incorporating additional financial and textual variables to improve the performance of the analysis
Trabajo Fin de Grado
Predicting M&A targets in the U.S. tech industry using ALBERT, FinBERT and Longformer modelsTitulación / Programa
Grado en Administración y Dirección de Empresas y Grado en Análisis de Negocios/Business AnalyticsMaterias/ categorías / ODS
KBAPalabras Clave
Procesamiento de Lenguaje Natural, Fusiones y Adquisiciones, Transformadores, Análisis de TextoNatural Language Processing, Mergers & Acquisitions, Transformers and Text analysis