Mental health risk classification through NLP

Girard, Charles Max-André

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/78535

Título :	Mental health risk classification through NLP
Autor :	Laguna Pradas, Ana Girard, Charles Max-André Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)
Palabras clave :	12 Matemáticas;1203 Ciencias de los ordenadores;120318 Sistemas de información, diseño y componentes
Fecha de publicación :	2023
Resumen :	Este proyecto tiene como objetivo crear una pipeline de procesamiento de texto para detectar riesgos tempranos de depresión en los mensajes de Telegram de los pacientes. Mediante el uso de datos de texto etiquetados del concurso de datos IberLEF, el objetivo principal es crear un algoritmo de clasificación supervisado que pueda proporcionar una probabilidad de que un individuo esté en riesgo de depresión. Este proyecto utilizará mensajes de texto enviados por 185 personas de habla hispana, 100 de las cuales fueron diagnosticadas como "depresivas" por 10 profesionales médicos y 85 de las cuales fueron consideradas "saludables". Se probaron exhaustivamente diferentes técnicas de procesamiento de lenguaje natural (NLP) junto con diferentes modelos de clasificación de aprendizaje automático (ML) para encontrar una pipeline que brindara la mejor precisión. El mejor modelo logró una precisión del 88%. This project aims to create a text processing pipeline in order to detect early risks of depression in Telegram messages from patients. By using labeled text data from the IberLEF data competition, the main goal is to create a supervised classification algorithm that can provide a probability of an individual being at risk of depression. This project will be using text messages sent from 185 spanish-speaking individuals, 100 of which were diagnosed as ‘depressive’ by 10 medical professionals and 85 of which were considered ‘healthy’. Different Natural Language Processing (NLP) techniques along with different Machine learning (ML) classifying models were exhaustively tested in order to find a pipeline that would yield the best accuracy. The best model achieved an accuracy of 88%.
Descripción :	Máster en Big Data. Tecnología y Analítica Avanzada/Master in Big Data Technologies and Advanced Analytics
URI :	http://hdl.handle.net/11531/78535
Aparece en las colecciones:	MBD-Trabajos Fin de Máster

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
TFM - Girard, Charles.pdf	Trabajo Fin de Máster	3,75 MB	Adobe PDF	Visualizar/Abrir
AnexoI.docx.pdf	Autorización	48,41 kB	Adobe PDF	Visualizar/Abrir Request a copy

Mostrar el registro Dublin Core completo del ítem