"ANALYTICAL FINANCE"
Resumen
Este Trabajo de Fin de Grado analiza el rendimiento de distintos modelos de clasificación de sentimiento aplicados a titulares de noticias financieras sobre cinco grandes empresas tecnológicas estadounidenses: Amazon, Apple, Google, Meta y Nvidia. Aunque el objetivo principal es evaluar en qué medida los modelos de clasificación de sentimiento permiten predecir el impacto de los titulares financieros sobre el precio de las acciones, el trabajo también analiza su capacidad para clasificar titulares según su tono (positivo, negativo o neutro), explorando su posible aplicación en estrategias de trading algorítmico.
Se comparan enfoques tradicionales de Machine Learning, como TF-IDF combinado con regresión logística, con modelos avanzados basados en lenguaje financiero y aprendizaje profundo, como FinBERT y redes neuronales LSTM. El análisis se realiza sobre un conjunto de más de 4.000 titulares enriquecidos con palabras clave financieras y tecnológicas, cruzados con series temporales mensuales de precios durante 2023. Para
interpretar el rendimiento de los modelos, se aplican técnicas de reducción de dimensionalidad (PCA) a los embeddings y se realiza un análisis detallado de errores por clase.
Los resultados muestran que el modelo LSTM es el más eficaz en la clasificación de sentimiento, con un F1-score macro de 0,652 y un F1-score ponderado de 0,680. Le siguen TF-IDF + regresión logística (macro F1 = 0,609; weighted F1 = 0,638) y FinBERT (macro F1 = 0,561; weighted F1 = 0,597). En conjunto, LSTM destaca por su capacidad para capturar patrones complejos en lenguaje financiero y por su coherencia
con las variaciones observadas en los precios, lo que lo convierte en el candidato más prometedor para aplicaciones predictivas. Se proponen líneas futuras centradas en mejorar el tratamiento de las clases minoritarias y en investigar ensambles de modelos para la optimización de diferentes capacidades. This Final Degree Project analyzes the performance of various sentiment classification models applied to financial news headlines about five major U.S. tech companies: Amazon, Apple, Google, Meta, and Nvidia. While the primary goal is to evaluate how effectively sentiment classification models can predict the impact of financial headlines on stock prices, the study also analyzes their performance in classifying headlines by tone
(positive, negative or neutral), exploring their potential use in algorithmic trading strategies.
The study compares traditional Machine Learning approaches, such as TF-IDF combined with logistic regression, with advanced deep learning and finance-specific models like FinBERT and LSTM networks. The analysis is based on over 4,000 headlines enriched with financial and tech-related keywords, matched with monthly stock prices from 2023. To interpret model behavior, techniques such as PCA are used to visualize latent embeddings, along with a detailed error analysis by sentiment class.
Results show that the LSTM model achieves the best performance in sentiment classification, with a macro F1-score of 0.652 and a weighted F1-score of 0.680. It is followed by TF-IDF + logistic regression (macro F1 = 0.609; weighted F1 = 0.638) and FinBERT (macro F1 = 0.561; weighted F1 = 0.597). Overall, LSTM stands out for its ability to capture complex patterns in financial language and for aligning well with observed price trends, making it the most promising candidate for predictive applications. Future work should focus on improving the handling of the minority classes and exploring ensemble and hybrid models that can optimize different features.
Trabajo Fin de Grado
"ANALYTICAL FINANCE"Titulación / Programa
Grado en Análisis de Negocios/Business Analytics y Grado en Relaciones InternacionalesMaterias/ categorías / ODS
KBAPalabras Clave
Análisis de sentimiento, Predicción, Trading Algorítmico, FinBERT, LSTM, Procesamiento del Lenguaje Natural (NLP).Sentiment Analysis, Prediction, Algorithmic Trading, FinBERT, LSTM, Natural Language Processing (NLP).