Análisis de texto en finanzas
Resumen
Los avances logrados en el siglo XXI a nivel tecnológico han afectado drásticamente a todos los aspectos de la vida, incluidas las finanzas. En este contexto de digitalización, se desarrolla el presente proyecto que busca conseguir un sistema de inteligencia artificial que mediante técnicas de NLP sea capaz de detectar el sentimiento con el que noticias financieras hacen referencia a empresas del sector farmacéutico y relacionar esta redacción con su desempeño en el mercado. Estas noticias fueron publicadas entre 2008 y 2018, por lo que no engloban noticias referentes a la pandemia de la COVID-19.
Para ello se ha llevado a cabo una revisión de la literatura comparando las alternativas para el campo de la Inteligencia Artificial como para el estudio de eventos, se optó por emplear herramientas pre entrenadas en Python y el modelo de los tres factores de Fama y French. A través de programación en Python, se han ido aplicando los algoritmos y herramientas empleadas siguiendo el procedimiento descrito en el texto. Finalmente se recogen los resultados de esta implementación y se presentan las conclusiones obtenidas.
Ambos objetivos iniciales, tanto el tratamiento de las noticias como el de los eventos, han obtenido unos resultados aceptables. Sin embargo, no ha sido posible mostrar la correlación entre ellos. Por ello que se proponen una serie de mejoras orientadas a perfeccionar los sistemas desarrollados. The technological advances achieved in the 21st century have drastically affected all aspects of life, including finance. In this context of digitization, this project aims to develop an artificial intelligence system that, through NLP techniques, is able to detect the sentiment with which financial news refer to companies in the pharmaceutical sector and relate this wording to their performance in the market. These news were published between 2008 and 2018, so they do not encompass news referring to the COVID-19 pandemic.
In order to meet these goals, a literature review was carried out comparing alternatives for the field of Artificial Intelligence as for the study of events, it was chosen to employ tools pre-trained in Python and the the Three Factors model of Fama and French. Through Python programming, the algorithms and tools used have been applied following the procedure described in the text. Finally, the results derived from this work are collected and conclusions obtained are presented.
Both initial objectives, the treatment of news and the treatment of events, have obtained acceptable results. However, it has not been possible to show the correlation between them. Therefore, a series of improvements aimed at perfecting the systems developed are proposed.
Trabajo Fin de Grado
Análisis de texto en finanzasTitulación / Programa
Grado en Administración y Dirección de Empresas y Máster Universitario en Ingeniería de TelecomunicaciónMaterias/ UNESCO
12 Matemáticas1203 Ciencias de los ordenadores
120304 Inteligencia artificial
Materias/ categorías / ODS
K2NPalabras Clave
NLP, Event Studies, Noticias financieras, Python, Modelo de los tres factoresNLP, Event Studies, Financial News, Python, 3-Factor Model