Guía práctica de implementación de topic modeling en R: analizando artículos periodísticos sobre el metaverso - Velilla Cadahía, María del Rocío
Resumen
El topic modeling es una técnica que, mediante algoritmos como el Latent Dirichlet Allocation (LDA), ayuda a entender cuáles son los temas principales en una colección de documentos de texto. A pesar de su creciente uso en el ámbito de la investigación y de la industria, la literatura existente no cuenta con una guía práctica de implementación en R del LDA que profundice en los aspectos técnicos del algoritmo. Por tanto, el presente trabajo, tras una explicación profunda del topic modeling y del algoritmo de LDA, desarrolla una guía práctica que aborda todo el proceso de topic modeling y explica cuestiones teóricas que surgen al implementarlo. La guía se construye a través de un caso de análisis sobre el metaverso en los artículos del periódico The Guardian y se desarrolla en cinco fases principales. Tras las tres primeras fases de recolección de datos, preprocesamiento del texto y aplicación del LDA, se interpretarán y visualizarán en la cuarta fase los catorce tópicos obtenidos. Finalmente, en la quinta y última fase, se propondrán posibles usos de los tópicos que acentuarán el potencial del topic modeling. El trabajo finalizará con las principales conclusiones y una propuesta de tres posibles extensiones del estudio realizado. Topic modeling is a technique that, through algorithms such as Latent Dirichlet Allocation (LDA), helps understand what the most relevant topics in a collection of text documents are. Despite its increasing use in the field of academic research and in the industry, the existing literature does not include a practical guide of LDA implementation in R that delves into the technical aspects of this algorithm. As a result of this, after a profound explanation of topic modeling and of the LDA algorithm, a practical guide that addresses the entire topic modeling process and the theoretical questions that arise during its implementation is developed. The practical guide is built through a case study on the metaverse in news articles from the newspaper The Guardian and is constructed in five different phases. After the first three phases of data collection, preprocessing of text, and application of LDA, fourteen topics will be interpreted and visualized in the fourth phase. Finally, in the fifth and final phase, possible uses of the retrieved topics will be suggested and will accentuate the potential of topic modeling. The thesis will finish with the main conclusions and a proposal of three possible further extensions of the work conducted.
Trabajo Fin de Grado
Guía práctica de implementación de topic modeling en R: analizando artículos periodísticos sobre el metaverso - Velilla Cadahía, María del RocíoTitulación / Programa
Grado en Administración y Dirección de Empresas y Grado en Análisis de Negocios/Business AnalyticsMaterias/ categorías / ODS
KBAPalabras Clave
topic modeling, Latent Dirichlet Allocation (LDA), guía práctica, R, metaversotopic modeling, Latent Dirichlet Allocation (LDA), practical guide, R, metaverse