Análisis de sentimientos financieros en noticias
Abstract
Este Trabajo de Fin de Máster se centra en el análisis de sentimientos financieros en noticias. El objetivo principal ha sido desarrollar un sistema que permita obtener noticias financieras a través de una API, puntuarlas en función de su sentimiento y comparar diferentes modelos de clasificación enfocados en el análisis de sentimientos financieros para encontrar el que mejor se ajusta al problema.
En primer lugar, se realizó la obtención de noticias financieras mediante una API, asegurando que se recopilase información relevante y actualizada. Posteriormente, se procedió al desarrollo y despliegue de una aplicación web que permitiera puntuar las noticias en función de su sentimiento, de cara a tener un dataset etiquetado a la hora de entrenar y validar los modelos.
Más adelante, se llevó a cabo el entrenamiento de modelos de análisis de sentimientos desde cero utilizando un dataset profesional. Se aplicaron técnicas de procesamiento de lenguaje natural y aprendizaje automático para entrenar modelos capaces de clasificar el sentimiento de las noticias financieras.
A continuación, se realizó una validación exhaustiva de los modelos, tanto aquellos entrenados desde cero como los modelos preentrenados, utilizando un dataset específico generado para este estudio. Se evaluaron diferentes métricas de rendimiento y se compararon los resultados obtenidos por cada modelo.
Finalmente, se llevó a cabo una comparación detallada de los resultados de los diferentes modelos para determinar cuál de ellos ofrecía la mejor precisión en el análisis
de sentimientos financieros. Esta comparación permitió identificar el modelo más eficaz y brindó información valiosa sobre las fortalezas y debilidades de cada enfoque.
En resumen, este Trabajo de Fin de Máster ha abordado de manera integral el análisis de sentimientos financieros en noticias, desde la obtención de datos hasta la comparación de modelos. This Master Thesis focuses on the analysis of financial sentiment in news. The main objective has been to develop a system that allows to retrieve financial news through an API, score them based on their sentiment and compare different sentiment analysis models to find the most effective one.
First, financial news was obtained through an API, ensuring that relevant and updated information was collected. Subsequently, a web application was developed and deployed to score the news based on sentiment, in order to have a labeled dataset to train and validate the models.
Furthermore, training of sentiment analysis models from scratch was carried out using a professional dataset. Natural language processing and machine learning techniques were applied to train models capable of classifying financial news sentiment.
Then, a thorough validation of the models, both those trained from scratch and the pre-trained models, was performed using a custom dataset generated specifically for this study. Different performance metrics were evaluated and the results obtained by each model were compared.
Finally, a detailed comparison of the results of the different models was carried out to determine which model provided the best accuracy in financial sentiment analysis. This comparison identified the most effective model and provided valuable information on the strengths and weaknesses of each approach.
In summary, this Master’s thesis has comprehensively addressed financial sentiment analysis in news, from data collection to model comparison.
Trabajo Fin de Máster
Análisis de sentimientos financieros en noticiasTitulación / Programa
Máster en Big Data. Tecnología y Analítica Avanzada/Master in Big Data Technologies and Advanced AnalyticsMaterias/ UNESCO
12 Matemáticas1203 Ciencias de los ordenadores
120317 Informática
Materias/ categorías / ODS
M8APalabras Clave
Análisis de sentimientos financieros, Noticias financieras, machine learning, Modelos de clasificación, Procesamiento de lenguaje natural, Modelos preentrenados, Comparación de resultados.Financial sentiment analysis, Financial news, Machine learning, Classification models, Natural language processing, Pre-trained models, Benchmarking.