ANALYTICAL FINANCE - Telematics + Machine Learning applied to Insurance: PAY HOW YOU DRIVE
Abstract
Los seguros de automóviles se han basado tradicionalmente en un número limitado de variables, como la edad, la ubicación o el tipo de vehículo, para fijar primas que supuestamente reflejan el riesgo. El problema es que estas variables son indicadores poco precisos.
Esta tesis argumenta que los datos telemáticos, combinados con el aprendizaje automático, pueden reemplazar este sistema de estimación por uno mucho más preciso y, francamente, más justo. Utilizando el conjunto de datos actuariales freMTPL2 junto con datos telemáticos sintéticos derivados del estudio de conducción naturalista highD, desarrollé y probé un marco de precios dinámicos «Pay How You Drive» (PHYD) que ajusta las primas mensualmente en función del comportamiento de conducción observado. Los modelos de potenciación de gradiente mejorados con telemática redujeron el error de predicción en más del 68 % en comparación con un modelo GLM tradicional (el RMSE disminuyó de 13,54 € a 4,30 €), y una puntuación de riesgo compuesta, que captura la velocidad, la distancia de seguimiento y los patrones de cambio de carril, se consolidó como la característica más informativa por un margen considerable. Una simulación de precios de doce meses demuestra cómo un conductor que mejora su historial de conducción podría situarse por debajo del umbral tradicional de prima fija a mediados de año, pagando considerablemente menos en diciembre. La tesis también aborda las realidades de la implementación: las preocupaciones sobre la privacidad, las restricciones regulatorias y el reto de comunicar la tarificación algorítmica a los clientes que simplemente desean comprender su factura. Motor insurance has long relied on the same handful of variables such as age, location or vehicle type, to set premiums that are meant to reflect risk. The problem is those variables are poor proxies.
This dissertation argues that telematics data, when combined with machine learning, can replace that system of guesswork with something far more accurate and, frankly, fairer. Using the freMTPL2 actuarial dataset alongside synthetic telematics data derived from the highD naturalistic driving study, I developed and tested a “Pay How You Drive” (PHYD) dynamic pricing framework that adjusts premiums monthly based on observed driving behavior. Telematics-enhanced gradient boosting models reduced prediction error by over 68% compared to a traditional GLM baseline (RMSE dropping from €13.54 to €4.30), with a composite risk score: capturing speed, following distance, and lane-change patterns, emerging as the single most informative feature by a considerable margin.
A twelve-month pricing simulation demonstrates how an improving driver could cross below the traditional fixed-premium threshold by mid-year, paying substantially less by December. The dissertation also addresses implementation realities: privacy concerns, regulatory constraints, and the challenge of communicating algorithmic pricing to customers who simply want to understand their bill.
Trabajo Fin de Grado
ANALYTICAL FINANCE - Telematics + Machine Learning applied to Insurance: PAY HOW YOU DRIVETitulación / Programa
Grado en Ingeniería en Tecnologías de Telecomunicación y Grado en Análisis de Negocios/Business AnalyticsMaterias/ categorías / ODS
KBAPalabras Clave
Telemática, Seguros Basados en el Uso, Aprendizaje Automático, Precios Dinámicos, Pay How You Drive, Ciencia Actuarial, GLM, Puntuación de RiesgosTelematics, Usage-Based Insurance, Machine Learning, Dynamic Pricing, Pay How You Drive, Actuarial Science, GLM, Risk Scoring.


