Detección automática de violencia o contenido sexual explícito en canciones con modelos largos de lenguaje
Resumen
El aumento del contenido sexual explícito en las canciones que escuchan los jóvenes, se ha
desarrollado ha sido objeto de inquietud social especialmente por el consumo masivo entre
los más jóvenes. El presente Trabajo Fin de Grado propone una solución tecnológica basada
en un sistema automatizado de detección de contenido explícito en las letras de canciones.
Para poder llevarlo a cabo se ha utilizado un modelo GPT, refinado mediante técnicas de
aprendizaje supervisado sobre un corpus de 100 canciones en castellano que han sido
previamente etiquetadas por una experta. De esta manera, el modelo será capaz de clasificar
canciones por “explícitas” o “no explícitas” con resultados empíricamente sólidos que
validan las hipótesis planteadas. De esta manera se plantea como el Business Analytics puede
contribuir a crear soluciones socialmente responsables que promuevan un consumo musical
más consciente y seguro. The rise of sexually explicit content in the songs young people listen to has become a matter of social concern, particularly due to its widespread consumption among adolescents. This Bachelor's Thesis proposes a technological solution based on an automated system for detecting explicit content in song lyrics. To implement this, a GPT model has been used and refined through supervised learning techniques on a corpus of 100 Spanish-language songs that were previously labeled by an expert. In this way, the model is capable of classifying songs as “explicit” or “non-explicit” with empirically robust results that validate the proposed hypotheses. This work illustrates how Business Analytics can contribute to the development of socially responsible solutions that promote a more conscious and safer music consumption.
Trabajo Fin de Grado
Detección automática de violencia o contenido sexual explícito en canciones con modelos largos de lenguajeTitulación / Programa
Grado en Análisis de Negocios/Business Analytics y Grado en DerechoMaterias/ categorías / ODS
KBAPalabras Clave
Contenido sexual explícito, Letras de canciones, Reguetón y trap, Modelo de lenguaje grande (LLM), GPT / GPT personalizado, Transformers, Aprendizaje supervisado, Fine-tuning, Detección automática, Clasificación binaria, Métricas de evaluación (precisión, sensibilidad, especificidad, exactitud)Sexually explicit content, song lyrics, reggaeton and trap, large language model (LLM), GPT / customized GPT, transformers, supervised learning, fine-tuning, automatic detection, binary classification, evaluation metrics (precision, recall, specificity, accuracy), Business Analytics, labeled corpus, urban language / slang, impact on adolescents, child protection, content moderation, parental control, social responsibility, music platforms (Spotify, Apple Music).