Análisis de datos biométricos recogidos por dispositivos wearable: desarrollo de un dashboard interactivo y un modelo predictivo de monitorización fisiológica
Resumen
El envejecimiento de la población y la presión sobre los sistemas sanitarios están empujando la salud hacia modelos más continuos y preventivos. En ese contexto, los wearables recogen señales fisiológicas durante todo el día y generan un volumen masivo de datos biométricos. El problema es que, en bruto, esos datos no son directamente útiles porque son ruidosos, densos y difíciles de interpretar directamente. El reto está en convertir esas señales en información útil.
De ahí parte este TFG, planteado como un ejercicio de Business Analytics. El objetivo es diseñar un pipeline completo que procese datos biométricos brutos y los convierta en métricas, predicciones y visualizaciones comprensibles, cubriendo toda la cadena analítica de principio a fin. Como base experimental se utiliza el dataset WESAD, una referencia consolidada que recoge señales multimodales de 15 sujetos mediante un dispositivo de pecho y una pulsera.
El trabajo se estructura en tres bloques: un proceso ETL que limpia y transforma las señales brutas en variables fisiológicas por ventanas temporales, un modelo predictivo que compara tres algoritmos de machine learning para la clasificación de estados afectivos, y un dashboard interactivo desplegado en la nube que traslada el pipeline a una interfaz visual.
El modelo final, un Random Forest, alcanza un 87,9% de accuracy en la clasificación de los estados afectivos del experimento. La actividad electrodérmica se identifica como la señal más discriminante, al concentrar el 42,0% de la importancia del modelo. Además, se construye un Stress Index como indicador resumen interpretable por un usuario no técnico.
El trabajo se presenta como prototipo de la capa analítica de Kora, una startup desarrollada en paralelo como TFG de ADE. Se cierra reconociendo sus limitaciones, principalmente el tamaño reducido de la muestra, y plantea como siguiente paso su validación con datos propios recogidos en un entorno real. Population ageing and growing pressure on healthcare systems are pushing healthcare toward more continuous and preventive models. In this context, wearables collect physiological signals throughout the day and generate a massive volume of biometric data. The problem is that, in raw form, these data are not directly useful because they are noisy, dense, and difficult to interpret. The real challenge is in transforming these signals into useful information.
This is the starting point of this thesis, conceived as a Business Analytics project. Its aim is to design a complete pipeline that processes raw biometric data and converts them into understandable metrics, predictions, and visualizations, covering the entire analytical chain from end to end. As an experimental basis, the study uses the WESAD dataset, a well-established benchmark that contains multimodal signals from 15 subjects collected through a chest-worn device and a wristband.
The project is structured into three main blocks: an ETL process that cleans and transforms raw signals into physiological variables computed over time windows, a predictive model that compares three machine learning algorithms for affective state classification, and an interactive dashboard deployed in the cloud that translates the pipeline into a visual interface.
The final model, a Random Forest, achieves 87.9% accuracy in classifying the affective states of the experiment. Electrodermal activity is identified as the most discriminative signal, accounting for 42.0% of the model’s total importance. In addition, a Stress Index is developed as a summary indicator that can be interpreted by a non-technical user.
This thesis is presented as a prototype of the analytical layer of Kora, a startup developed in parallel as a Business Administration bachelor’s thesis. It concludes by acknowledging its main limitations, particularly the small sample size, and proposes as a next step its validation with proprietary data collected in a real-world setting.
Trabajo Fin de Grado
Análisis de datos biométricos recogidos por dispositivos wearable: desarrollo de un dashboard interactivo y un modelo predictivo de monitorización fisiológicaTitulación / Programa
Grado en Administración y Dirección de Empresas y Grado en Análisis de Negocios/Business AnalyticsMaterias/ categorías / ODS
KBAPalabras Clave
Business Analytics, pipeline de datos, ETL, wearables, machine learning, dashboard interactivo, Random Forest, WESADBusiness Analytics, data pipeline, ETL, wearables, machine learning, dashboard, Random Forest, WESAD


