Mostrar el registro sencillo del ítem

dc.contributor.advisorHall, Neales-ES
dc.contributor.authorAlsina Piró, Eduardes-ES
dc.contributor.otherUniversidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)es_ES
dc.date.accessioned2020-02-14T15:18:25Z
dc.date.availablees_ES
dc.date.issued2020es_ES
dc.identifier.urihttp://hdl.handle.net/11531/44922
dc.descriptionGrado en Ingeniería en Tecnologías de Telecomunicación y Grado en Administración y Dirección de Empresases_ES
dc.description.abstractEste proyecto ha desarrollado y entrenado un modelo de aprendizaje automático (machine learning) que recibe archivos de música y los separa en sus distintos componentes: voces, percusión, bajo y otros. La separación se basa en un modelo de deep learning programado en PyTorch y utiliza la arquitectura Wave-U-Net. El diseño final también incluye un modelo de separación alternativo llamado Open-Unmix que, según las pruebas realizadas, suele ofrecer mejor separación a costa de mayor tiempo de procesamiento y consumo de recursos. Este motor de separación se ha integrado con un front-end doble, para web y para dispositivos Apple. La integración se ha diseñado mediante peticiones HTTP estándar y siguiendo la filosofía RESTful. Los archivos resultantes de la separación pueden ser manipulados y descargados, pero también se almacenan en el back-end para posteriores consultas. Se ha dispuesto una capa de autenticación básica para controlar el acceso a este almacenamiento. El proyecto forma parte de otro proyecto de mayor envergadura en el que el autor ha participado durante su estancia en la Universidad de Texas en Austin. El objetivo final de ese proyecto ha sido el diseño de una solución integral para separación de sonidos. Ha estado patrocinado por la compañía Harman International (filial de Samsung), la cual ha proporcionado asesoramiento y financiación.es-ES
dc.description.abstractThis project has designed and trained a machine learning model that receives music files and separates them into their different components: vocals, percussion, bass, and others. The separation is based on a deep learning model programmed in PyTorch and it uses the Wave-U-Net architecture. An alternative separation model called Open-Unmix has also been included in the final design. According to the tests carried out, this model usually offers better separation at the cost of more processing time and resource consumption. This separation engine has been integrated with a dual front-end, for the web and for Apple devices. The integration has been designed using standard HTTP requests and following the RESTful design philosophy. The resulting files from the separation can be played and downloaded, but are also stored in the back-end for subsequent queries. A basic authentication layer has been implemented to control access to this storage. The project is part of a larger project in which the author has participated during his stay at the University of Texas at Austin. The final goal of that project has been the design of a comprehensive solution for sound separation. It has been sponsored by Harman International (a subsidiary of Samsung), which has provided advice and funding.en-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoen-GBes_ES
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United Stateses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/es_ES
dc.subject33 Ciencias tecnológicases_ES
dc.subject3325 Tecnología de las telecomunicacioneses_ES
dc.subject332501 Radiodifusión, sonido y televisiónes_ES
dc.subject.otheres_ES
dc.titleBack-End and Integration of a Sound Separation Solutiones_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
dc.rights.accessRightsinfo:eu-repo/semantics/restrictedAccesses_ES
dc.keywordsMúsica, Separación de sonidos, Machine Learning, Wave-U-Net, Open-Unmix.es-ES
dc.keywordsMusic, Sound separation, Machine Learning, Wave-U-Net, Open-Unmix.en-GB


Ficheros en el ítem

Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivs 3.0 United States
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivs 3.0 United States