Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/105888
Título : Desarrollo de un modelo predictivo para estimar el éxito de canciones mediante parámetros musicales y de popularidad
Autor : Martín-Corral Calvo, David
Velilla Arana, Marta
Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)
Fecha de publicación : 2026
Resumen : Este Trabajo Fin de Máster presenta el desarrollo de un pipeline predictivo e interpretable para estimar el éxito comercial de canciones, enmarcado en el paradigma científico Hit Song Science (HSS). A diferencia de los enfoques tradicionales de "caja negra" basados en Deep Learning o de aquellos sesgados lingüísticamente por el procesamiento de letras, esta investigación propone un modelo híbrido agnóstico al idioma que combina procesamiento digital de señales (PDS) y aprendizaje automático estructurado. La metodología comienza con la extracción de 15 descriptores espectrales y temporales (como sonoridad, tempo, energía y centroide espectral) a partir de señales de audio utilizando la librería Librosa y la Transformada de Fourier de Corto Tiempo (STFT). Estos atributos físicos se combinan con metadatos contextuales y sociales procedentes del Million Song Dataset. Para el modelado predictivo, se optimizó un algoritmo de ensamble Random Forest Regressor entrenado en la nube (AWS), logrando un coeficiente de determinación (R^2) de 0,4329. Este resultado supera significativamente los estándares de la literatura de recuperación de información musical (MIR) puramente acústica, cuyos límites históricos oscilan entre 0,15 y 0,35. El análisis de relevancia revela que, si bien el capital social previo del artista (familiaridad y popularidad) acumula más del 66% del peso predictivo, atributos físicos como la sonoridad (loudness) operan como un filtro técnico indispensable de comercialización. Finalmente, el sistema se integró en una aplicación web interactiva desarrollada en Dash y conectada en tiempo real con la API de Spotify. Esta plataforma permite a compositores y sellos independientes realizar auditorías analíticas de sus canciones, democratizando el acceso a métricas predictivas interpretables en una industria musical altamente competitiva.
This Master's Thesis presents the development of an end-to-end, interpretable predictive pipeline designed to estimate the commercial success of musical tracks, framed within the scientific paradigm of Hit Song Science (HSS). Unlike traditional "black-box" approaches based on Deep Learning or those linguistically biased by lyric natural language processing, this research proposes a language-agnostic hybrid model that combines digital signal processing (DSP) and structured machine learning. The methodology begins with the extraction of 15 spectral and temporal descriptors (such as loudness, tempo, energy, and spectral centroid) from raw audio signals using the Librosa library and the Short-Time Fourier Transform (STFT). These physical attributes are then combined with contextual and social metadata sourced from the Million Song Dataset. For the predictive modeling phase, an optimized Random Forest Regressor ensemble algorithm was trained on the cloud (AWS), achieving a coefficient of determination ($R^2$) of 0.4329. This result significantly outperforms the benchmarks found in purely acoustic Music Information Retrieval (MIR) literature, whose historical limits typically range between 0.15 and 0.35. Feature importance analysis reveals that while the artist's prior social capital (familiarity and popularity) accounts for over 66% of the predictive weight, physical attributes such as loudness operate as an indispensable technical filter for commercialization. Finally, the entire system was integrated into an interactive web application built with Dash and connected in real-time to the Spotify API. This platform enables independent songwriters and record labels to conduct analytical audits of their tracks, democratizing access to interpretable predictive metrics within a highly competitive music industry.
Descripción : Grado en Análisis de Negocios/Business Analytics y Máster Universitario en Ingeniería de Telecomunicación
URI : http://hdl.handle.net/11531/105888
Aparece en las colecciones: TFG, TFM (temporales)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TFM_VelillaAranaMarta.pdfTrabajo Fin de Máster1,83 MBAdobe PDFVisualizar/Abrir
Anexo I.pdfAutorización621,61 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.