Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/76636
Título : Análisis de la influencia de la información desestructurada en la cotización de empresasdel sector energético
Autor : García de Garmendia, Antonio
Corella Gómez, María
Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)
Fecha de publicación : 2023
Resumen : En este proyecto se ha contruído un modelo de predicción de precios de acciones mediante la frecuencia de aparición de las palabras en los titulares de noticias. El objetivo del modelo es evaluar la influencia de la información desestrcuturada en la cotización de empresas del sector energético. El trabajo incluye un planteamiento teórico de la hipótesis, un caso práctico y un estudio económico de la viabilidad de convertir el modelo en una stratup fintech. Se concluye que determinados sucesos, temáticas o sentimientos reflejados en las noticias tienen el potencial de predecir las dinámicas futuras del mercado bursátil. Además, se demuestra que el modelo no solo es efectivo desde el punto de vista técnico, sino que también tiene un potencial económico significativo. CASO DE ESTUDIO Los datos de entrada al modelo provienen de la recopilación de precios históricos de tres índices diferentes, IBEX35, IBEX-Energy y ELE (ticker de Endesa), y de noticias de los principales periódicos españoles durante los días de mayor variación de precios para cada uno de los índices. Se lleva a cabo un análisis del lenguaje utilizado en las noticias y su relación con las variaciones de precios haciendo uso de un código Python sencillo. Tras analizar la frecuencia de las palabras en los titulares de noticias durante los días de mayores subidas y bajadas de los índices, se crea un 'diccionario' de palabras clave y se explora su correlación con estas variaciones de precios. Finalmente, el modelo se aplica a un día específico, fuera del conjunto de datos de entrenamiento, con el objetivo de predecir la dirección de los precios de las acciones de los tres índices estudiados y así evaluar el rendimiento del modelo. RESULTADOS El coeficiente de correlación de Pearson entre la frecuencia de aparición y la variación de precio en un día confirma la relevancia de ciertas palabras en la cotización de ciertas empresas: se descubre que, para cada índice, existen palabras clave cuya aparición en las noticias está correlacionada con la variación de su precio. Durante la evaluación del rendimiento, las métricas del MSE y R² proporcionan evidencia de que el modelo desarrollado logra predecir con cierta precisión las variaciones en los precios de las acciones. CONCLUSIONES La investigación revela que la inclusión del análisis de noticias en los modelos de predicción de precios de acciones puede aportar una visión más completa y matizada del comportamiento del mercado. Este hallazgo resalta la utilidad de las técnicas avanzadas de procesamiento del lenguaje natural y aprendizaje automático en las finanzas cuantitativas, y sugiere la necesidad de explorar más a fondo la integración de factores cualitativos en los modelos financieros cuantitativos.
In this project, a stock price prediction model has been built using the frequency of occurrence of words in news headlines. The objective of the model is to evaluate the influence of uncut information on the share price of companies in the energy sector. The paper includes a theoretical approach to the hypothesis, a case study and an economic study of the feasibility of converting the model into a fintech startup. It is concluded that certain events, themes, or sentiments reflected in the news have the potential to predict future stock market dynamics. Furthermore, it is shown that the model is not only effective from a technical point of view, but also has significant economic potential. CASE STUDY The input data for the model comes from the collection of historical prices of three different indexes, IBEX35, IBEX-Energy and ELE (Endesa ticker), and news from the main Spanish newspapers during the days of highest price variation for each of the indexes. An analysis of the language used in the news and its relationship with price variations is carried out using a simple Python code. After analyzing the frequency of the words in the news headlines during the days with the largest increases and decreases in the indexes, a 'dictionary' of keywords is created and their correlation with these price variations is explored. Finally, the model is applied to a specific day, outside the training data set, in order to predict the direction of the stock prices of the three indexes studied and thus evaluate the performance of the model. RESULTS The Pearson correlation coefficient between the frequency of appearance and the price variation in a day confirms the relevance of certain words in the share price of certain companies: it is found that, for each index, there are keywords whose appearance in the news is correlated with the direction of their price. During the performance evaluation, the MSE and R² metrics provide evidence that the developed model manages to predict with some accuracy the variations in stock prices. CONCLUSIONS The research reveals that the inclusion of news analysis in stock price prediction models can provide a more complete and nuanced view of market behaviour. This finding highlights the utility of advanced natural language processing and machine learning techniques in quantitative finance and suggests the need to further explore the integration of qualitative factors into quantitative financial models.
Descripción : Grado en Ingeniería en Tecnologías Industriales y Grado en Administración y Dirección de Empresas
URI : http://hdl.handle.net/11531/76636
Aparece en las colecciones: KTI-Trabajos Fin de Grado

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
AnexoA-Corella.pdfAutorización221,96 kBAdobe PDFVisualizar/Abrir     Request a copy
TFG_CorellaGomezMaria.pdfTrabajo Fin de Grado2,2 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.