Back-End and Integration of a Sound Separation Solution

Alsina Piró, Eduard

dc.contributor.advisor	Hall, Neal	es-ES
dc.contributor.author	Alsina Piró, Eduard	es-ES
dc.contributor.other	Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)	es_ES
dc.date.accessioned	2020-02-14T15:18:25Z
dc.date.available		es_ES
dc.date.issued	2020	es_ES
dc.identifier.uri	http://hdl.handle.net/11531/44922
dc.description	Grado en Ingeniería en Tecnologías de Telecomunicación y Grado en Administración y Dirección de Empresas	es_ES
dc.description.abstract	Este proyecto ha desarrollado y entrenado un modelo de aprendizaje automático (machine learning) que recibe archivos de música y los separa en sus distintos componentes: voces, percusión, bajo y otros. La separación se basa en un modelo de deep learning programado en PyTorch y utiliza la arquitectura Wave-U-Net. El diseño final también incluye un modelo de separación alternativo llamado Open-Unmix que, según las pruebas realizadas, suele ofrecer mejor separación a costa de mayor tiempo de procesamiento y consumo de recursos. Este motor de separación se ha integrado con un front-end doble, para web y para dispositivos Apple. La integración se ha diseñado mediante peticiones HTTP estándar y siguiendo la filosofía RESTful. Los archivos resultantes de la separación pueden ser manipulados y descargados, pero también se almacenan en el back-end para posteriores consultas. Se ha dispuesto una capa de autenticación básica para controlar el acceso a este almacenamiento. El proyecto forma parte de otro proyecto de mayor envergadura en el que el autor ha participado durante su estancia en la Universidad de Texas en Austin. El objetivo final de ese proyecto ha sido el diseño de una solución integral para separación de sonidos. Ha estado patrocinado por la compañía Harman International (filial de Samsung), la cual ha proporcionado asesoramiento y financiación.	es-ES
dc.description.abstract	This project has designed and trained a machine learning model that receives music files and separates them into their different components: vocals, percussion, bass, and others. The separation is based on a deep learning model programmed in PyTorch and it uses the Wave-U-Net architecture. An alternative separation model called Open-Unmix has also been included in the final design. According to the tests carried out, this model usually offers better separation at the cost of more processing time and resource consumption. This separation engine has been integrated with a dual front-end, for the web and for Apple devices. The integration has been designed using standard HTTP requests and following the RESTful design philosophy. The resulting files from the separation can be played and downloaded, but are also stored in the back-end for subsequent queries. A basic authentication layer has been implemented to control access to this storage. The project is part of a larger project in which the author has participated during his stay at the University of Texas at Austin. The final goal of that project has been the design of a comprehensive solution for sound separation. It has been sponsored by Harman International (a subsidiary of Samsung), which has provided advice and funding.	en-GB
dc.format.mimetype	application/pdf	es_ES
dc.language.iso	en-GB	es_ES
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 United States	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	es_ES
dc.subject	33 Ciencias tecnológicas	es_ES
dc.subject	3325 Tecnología de las telecomunicaciones	es_ES
dc.subject	332501 Radiodifusión, sonido y televisión	es_ES
dc.subject.other		es_ES
dc.title	Back-End and Integration of a Sound Separation Solution	es_ES
dc.type	info:eu-repo/semantics/bachelorThesis	es_ES
dc.rights.accessRights	info:eu-repo/semantics/restrictedAccess	es_ES
dc.keywords	Música, Separación de sonidos, Machine Learning, Wave-U-Net, Open-Unmix.	es-ES
dc.keywords	Music, Sound separation, Machine Learning, Wave-U-Net, Open-Unmix.	en-GB

Ficheros en el ítem

Nombre:: Autoria.pdf
Tamaño:: 161.4Kb
Formato:: PDF
Descripción:: Autorización

Ver/

Nombre:: TFG - Alsina Piro, Eduard.pdf
Tamaño:: 7.536Mb
Formato:: PDF
Descripción:: Trabajo Fin de Grado

Ver/

Este ítem aparece en la(s) siguiente(s) colección(ones)

KTT-Trabajos Fin de Grado

Mostrar el registro sencillo del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivs 3.0 United States