Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/94675
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorPizarroso Gonzalo, Jaimees-ES
dc.contributor.advisorOcchipinti Liberman, Andréses-ES
dc.contributor.authorRey Sánchez, Emmaes-ES
dc.contributor.otherUniversidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)es_ES
dc.date.accessioned2024-09-30T18:39:09Z-
dc.date.available2024-09-30T18:39:09Z-
dc.date.issued2025es_ES
dc.identifier.urihttp://hdl.handle.net/11531/94675-
dc.descriptionGrado en Ingeniería Matemática e Inteligencia Artificiales_ES
dc.description.abstractEste proyecto investiga si un régimen de entrenamiento en dos etapas puede mejorar la clasificación de géneros musicales. En lugar de entrenar modelos de deep learning directamente sobre un gran número de géneros detallados, se realiza una primera etapa en la que los géneros similares se agrupan en doce "macrogéneros". Los modelos se entrenan inicialmente con esta tarea simplificada y luego se afinan para clasificar los 103 géneros originales. Usando espectrogramas de Mel como entrada y evaluando arquitecturas CNN, ResNet-18 y Vision Transformer, el estudio concluye que el preentrenamiento jerárquico mejora la generalización en conjuntos de datos a gran escala y desbalanceados. Se utiliza el dataset Free Music Archive (FMA) como referencia principal.es-ES
dc.description.abstractThis project investigates whether a two-stage training regime can improve music genre classification. Instead of training deep learning models directly on a large number of fine-grained genres, a first stage groups similar genres into twelve "macrogenres." Models are initially trained on this simplified task and then fine-tuned to classify the original 103 genres. Using Mel-spectrograms as input and evaluating CNN, ResNet-18, and Vision Transformer architectures, the study finds that hierarchical pretraining improves generalization in large-scale, imbalanced datasets. The Free Music Archive (FMA) dataset is used as the main benchmark.en-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoes-ESes_ES
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United Stateses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/es_ES
dc.subject.otherKMIes_ES
dc.titleLeveraging Natural Language Processing Techniques for Music Metadata Enhancementes_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.keywordsClasificación Macrogéneros Espectrogramas Generalización Deep learninges-ES
dc.keywordsClassification Macrogenres Spectrograms Generalization Deep learningen-GB
Aparece en las colecciones: KMI-Trabajos Fin de Grado

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TFG_EMMA_REY_SANCHEZ.pdfTrabajo Fin de Grado1,66 MBAdobe PDFVisualizar/Abrir
autoria.pdfAutorización12,21 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.