Show simple item record

dc.contributor.advisorCarrero Muñiz, Didoes-ES
dc.contributor.authorSantos González, Diego de loses-ES
dc.contributor.otherUniversidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)es_ES
dc.date.accessioned2025-09-21T10:17:48Z
dc.date.available2025-09-21T10:17:48Z
dc.date.issued2026es_ES
dc.identifier.urihttp://hdl.handle.net/11531/104368
dc.descriptionGrado en Ingeniería en Tecnologías de Telecomunicaciónes_ES
dc.description.abstractLa voz no solo transmite lo que una persona dice. En una grabación quedan también pequeñas variaciones de ritmo, intensidad, pausas y estabilidad vocal que pueden cambiar cuando existe una alteración emocional. A partir de esa idea se plantea este trabajo, centrado en estudiar si esas diferencias acústicas pueden ayudar a distinguir distintos estados relacionados con depresión sin utilizar texto, imagen ni otras señales biomédicas. El punto de partida fue un conjunto de grabaciones etiquetadas en tres grupos: ausencia de depresión, depresión grado 1 y depresión grado 2. Cada audio se convirtió en variables numéricas extraídas directamente de la señal, de forma que los modelos pudieran trabajar sobre información medible y no sobre una valoración subjetiva del habla. Al analizar las muestras apareció una dificultad clara. Los casos sin depresión y los más severos quedaban mejor separados, mientras que la clase intermedia se mezclaba con ambas zonas. Esa frontera poco limpia se veía en las matrices de confusión y volvía a aparecer al representar los datos mediante KDE, PCA y clustering. Tras comparar varios clasificadores, CatBoost fue el modelo seleccionado por su equilibrio entre rendimiento y estabilidad. Las pruebas con datos internos y externos mostraron predicciones consistentes, aunque los estados intermedios siguieron siendo la parte más difícil del problema. El trabajo deja una base técnica para seguir explorando el análisis automático de voz como apoyo en contextos de salud mental.es-ES
dc.description.abstractThe voice conveys more than just what a person says. A recording also captures subtle variations in rhythm, intensity, pauses, and vocal stability that can change when a person is emotionally distressed. This research project is based on that idea and focuses on investigating whether these acoustic differences can help distinguish various states related to depression without using text, images, or other biomedical signals. The starting point was a set of recordings labeled into three groups: no depression, grade 1 depression, and grade 2 depression. Each audio clip was converted into numerical variables extracted directly from the signal, so that the models could work with measurable information rather than a subjective assessment of speech. Upon analyzing the samples, a clear difficulty emerged. The cases without depression and the most severe ones were better separated, while the intermediate class overlapped with both groups. This blurred boundary was evident in the confusion matrices and reappeared when representing the data using KDE, PCA, and clustering. After comparing several classifiers, CatBoost was selected for its balance between performance and stability. Tests with internal and external data showed consistent predictions, although intermediate states remained the most challenging part of the problem. ThE work lays a technical foundation for further exploration of automatic voice analysis as a tool in mental health settingsen-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoen-GBes_ES
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United Stateses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/es_ES
dc.subject.otherKTT (GITT)es_ES
dc.titleDetección temprana de depresión mediante señales de vozes_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.keywordsseñales de voz depresión Aprendizaje supervisado Clasificación multiclase Características acústicas Machine Learninges-ES
dc.keywordsvoice signals depression Supervised learning Multi-class classification Acoustic features Machine learningen-GB


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States