Análisis de Sentimientos y Modelado de Tópicos en Tweets relacionados con el Abandono del Hábito de Fumar
Resumen
Enfrentar el consumo de tabaco como un problema de salud pública es un desafío significativo. Es fundamental que las autoridades sanitarias tengan acceso a información actualizada sobre las percepciones y actitudes ciudadanas respecto al tabaquismo para desarrollar y ajustar políticas de salud efectivas. Este acceso permite a las autoridades adaptarse mejor a las necesidades contemporáneas y optimizar las intervenciones en esta área crítica de salud pública.
En este contexto, la plataforma X (anteriormente conocida como Twitter) se ha mostrado como una fuente de datos valiosa para identificar tendencias y evaluar opiniones públicas en tiempo real, proporcionando una visión detallada y accesible de las actitudes de la ciudadanía. La efectividad de esta plataforma ha sido reconocida por investigadores de diversas partes del mundo que han empleado estrategias como el modelado de tópicos con LDA (Latent Dirichlet Allocation) y el análisis de sentimientos con VADER (Valence Aware Dictionary and Sentiment Reasoner)
para recopilar y analizar datos. Este trabajo también adopta la herramienta de modelado de tópicos LDA y la técnica de análisis de sentimientos VADER para profundizar en las percepciones sobre el tabaco en X. La metodología propuesta en este trabajo abarca varios pasos, desde la selección del dataset y el tratamiento de los datos, hasta el análisis descriptivo de los términos más relevantes, la categorización de los tópicos de discusión y el análisis de sentimientos.
Como resultados, este trabajo de fin de grado ha identificado 4 tópicos principales: ``Abandono de Productos de Nicotina'', ``Opiniones sobre el Consumo de Nicotina y Alcohol'', ``Dinámicas Sociales relacionadas con el Consumo de Tabaco'' y ``Control y Regulación del Uso de Tabaco y Marihuana''. Estos tópicos se presentan en orden descendente de discusión, siendo el abandono de la nicotina el más debatido y la regulación de su uso el menos mencionado. Por su parte, el análisis de sentimientos ha evidenciado que el tono predominante es neutral con un sesgo ligeramente positivo. Según las medias obtenidas en el diagrama de cada tópico, el tercero es el más negativo, mientras que el segundo es el más positivo, aunque ambos se mantienen más cercanos a una tono neutral. Las opiniones sobre el abandono de la nicotina varían de neutrales a ligeramente positivas, reflejando un debate sobre los beneficios de dejar ese hábito. En cuanto al consumo de tabaco y alcohol, existe una división cultural equilibrada entre la aceptación social y los riesgos para la salud. Las dinámicas sociales muestran una aceptación moderada del tabaco, mientras que las actitudes hacia la regulación muestran una sociedad dividida entre la necesidad de control y la defensa de la libertad personal. Tackling tobacco use as a public health problem is a significant challenge. It is essential for health authorities to have access to up-to-date information on citizens' perceptions and attitudes towards smoking in order to develop and adjust effective health policies. This access allows authorities to better adapt to contemporary needs and to optimise interventions in this critical area of public health.
In this context, the X platform (formerly known as Twitter) has proven to be a valuable data source for identifying trends and assessing public opinion in real time, providing a detailed and accessible view of citizen attitudes. The effectiveness of this platform has been recognised by researchers from around the world who have employed strategies such as topic modelling with LDA (Latent Dirichlet Allocation) and sentiment analysis with VADER (Valence Aware Dictionary and Sentiment Reasoner)
(Valence Aware Dictionary and Sentiment Reasoner) to collect and analyse data. This paper also adopts the topic modelling tool LDA and the sentiment analysis technique VADER to delve into the perceptions about tobacco in X. The methodology proposed in this paper covers several steps, from dataset selection and data processing, to descriptive analysis of the most relevant terms, categorisation of discussion topics and sentiment analysis.
As results, this thesis has identified 4 main topics: ``Nicotine Product Abandonment'', ``Opinions on Nicotine and Alcohol Use'', ``Social Dynamics related to Tobacco Use'' and ``Control and Regulation of Tobacco and Marijuana Use''. These topics are presented in descending order of discussion, with nicotine cessation being the most debated and regulation of nicotine use the least mentioned. The sentiment analysis showed that the predominant tone was neutral with a slightly positive bias. According to the averages obtained in the diagram for each topic, the third topic is the most negative, while the second is the most positive, although both remain closer to a neutral tone.opinions on nicotine cessation vary from neutral to slightly positive, reflecting a debate on the benefits of quitting. On tobacco and alcohol use, there is a balanced cultural divide between social acceptance and health risks. Social dynamics show a moderate acceptance of smoking, while attitudes towards regulation show a society divided between the need for control and the defence of personal freedom.
Trabajo Fin de Grado
Análisis de Sentimientos y Modelado de Tópicos en Tweets relacionados con el Abandono del Hábito de FumarTitulación / Programa
Grado en Administración y Dirección de Empresas y Grado en Análisis de Negocios/Business AnalyticsMaterias/ categorías / ODS
KBAPalabras Clave
Tabaco,XTobacco,X