Mostrar el registro sencillo del ítem

dc.contributor.advisorPizarroso Gonzalo, Jaimees-ES
dc.contributor.advisorOcchipinti Liberman, Andréses-ES
dc.contributor.authorRey Sánchez, Emmaes-ES
dc.contributor.otherUniversidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)es_ES
dc.date.accessioned2024-09-30T18:39:09Z
dc.date.available2024-09-30T18:39:09Z
dc.date.issued2025es_ES
dc.identifier.urihttp://hdl.handle.net/11531/94675
dc.descriptionGrado en Ingeniería Matemática e Inteligencia Artificiales_ES
dc.description.abstractEste proyecto investiga si un régimen de entrenamiento en dos etapas puede mejorar la clasificación de géneros musicales. En lugar de entrenar modelos de deep learning directamente sobre un gran número de géneros detallados, se realiza una primera etapa en la que los géneros similares se agrupan en doce "macrogéneros". Los modelos se entrenan inicialmente con esta tarea simplificada y luego se afinan para clasificar los 103 géneros originales. Usando espectrogramas de Mel como entrada y evaluando arquitecturas CNN, ResNet-18 y Vision Transformer, el estudio concluye que el preentrenamiento jerárquico mejora la generalización en conjuntos de datos a gran escala y desbalanceados. Se utiliza el dataset Free Music Archive (FMA) como referencia principal.es-ES
dc.description.abstractThis project investigates whether a two-stage training regime can improve music genre classification. Instead of training deep learning models directly on a large number of fine-grained genres, a first stage groups similar genres into twelve "macrogenres." Models are initially trained on this simplified task and then fine-tuned to classify the original 103 genres. Using Mel-spectrograms as input and evaluating CNN, ResNet-18, and Vision Transformer architectures, the study finds that hierarchical pretraining improves generalization in large-scale, imbalanced datasets. The Free Music Archive (FMA) dataset is used as the main benchmark.en-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoes-ESes_ES
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United Stateses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/es_ES
dc.subject.otherKMIes_ES
dc.titleLeveraging Natural Language Processing Techniques for Music Metadata Enhancementes_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.keywordsClasificación Macrogéneros Espectrogramas Generalización Deep learninges-ES
dc.keywordsClassification Macrogenres Spectrograms Generalization Deep learningen-GB


Ficheros en el ítem

Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivs 3.0 United States
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivs 3.0 United States