Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/11531/78535
Título : | Mental health risk classification through NLP |
Autor : | Laguna Pradas, Ana Girard, Charles Max-André Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI) |
Palabras clave : | 12 Matemáticas;1203 Ciencias de los ordenadores;120318 Sistemas de información, diseño y componentes |
Fecha de publicación : | 2023 |
Resumen : | Este proyecto tiene como objetivo crear una pipeline de procesamiento de texto para detectar riesgos tempranos de depresión en los mensajes de Telegram de los pacientes. Mediante el uso de datos de texto etiquetados del concurso de datos IberLEF, el objetivo principal es crear un algoritmo de clasificación supervisado que pueda proporcionar una probabilidad de que un individuo esté en riesgo de depresión. Este proyecto utilizará mensajes de texto enviados por 185 personas de habla hispana, 100 de las cuales fueron diagnosticadas como "depresivas" por 10 profesionales médicos y 85 de las cuales fueron consideradas "saludables". Se probaron exhaustivamente diferentes técnicas de procesamiento de lenguaje natural (NLP) junto con diferentes modelos de clasificación de aprendizaje automático (ML) para encontrar una pipeline que brindara la mejor precisión. El mejor modelo logró una precisión del 88%. This project aims to create a text processing pipeline in order to detect early risks of depression in Telegram messages from patients. By using labeled text data from the IberLEF data competition, the main goal is to create a supervised classification algorithm that can provide a probability of an individual being at risk of depression. This project will be using text messages sent from 185 spanish-speaking individuals, 100 of which were diagnosed as ‘depressive’ by 10 medical professionals and 85 of which were considered ‘healthy’. Different Natural Language Processing (NLP) techniques along with different Machine learning (ML) classifying models were exhaustively tested in order to find a pipeline that would yield the best accuracy. The best model achieved an accuracy of 88%. |
Descripción : | Máster en Big Data. Tecnología y Analítica Avanzada/Master in Big Data Technologies and Advanced Analytics |
URI : | http://hdl.handle.net/11531/78535 |
Aparece en las colecciones: | MBD-Trabajos Fin de Máster |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
TFM - Girard, Charles.pdf | Trabajo Fin de Máster | 3,75 MB | Adobe PDF | Visualizar/Abrir |
AnexoI.docx.pdf | Autorización | 48,41 kB | Adobe PDF | Visualizar/Abrir Request a copy |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.