Desarrollo de herramienta completa de predicción a corto plazo de consumo de Gas de cartera de comercializadora usando herramientas de Aprendizaje Automático
Abstract
El Trabajo Fin de Máster presenta una plataforma integrada para predecir el consumo diario de gas de una comercializadora mediante machine learning y una herramienta de apoyo para la previsión a largo plazo. Tras automatizar la ingestión y limpieza de datos de consumo, meteorología y festivos, se ensamblan dinámicamente tres modelos (ARIMA, CatBoost y LightGBM) optimizados por grid-search y combinados con una mediana ponderada según precisión histórica. Para garantizar continuidad en horizontes de hasta siete días, se aplican suavizados horizontal y vertical que amortiguan picos abruptos.
El modelo ensamblado alcanza un error porcentual absoluto mediano (APE mediana) de 7,13 % en la semana de prueba del 1 al 7 de junio de 2025, con un APE
mediano por debajo del 5 % en los dos primeros días de horizonte, cumpliendo así los requisitos operativos de la compañía. Además, durante el periodo de evaluación
de cinco meses, de enero a mayo de 2025, el modelo obtuvo un APE mediano de 5,15 % tras aplicar procedimientos de suavizado y estabilización, evidenciando
consistencia en las predicciones diarias al ampliar el conjunto de prueba.
Además, se desarrolla una herramienta de apoyo para la previsión a corto plazo cuyo objetivo no es tanto minimizar un error concreto, sino proporcionar escenarios
de demanda bajo distintos supuestos climáticos. Para ello, se estiman las betas de la demanda frente a la temperatura mediante regresiones lineales segmentadas
por mes y tipo de día, y se generan escenarios de consumo ante variaciones de temperatura de ±1, ±2 y ±3 °C Se generan escenarios de consumo considerando
variaciones de temperatura de ±1, ±2 y ±3 °C, así como escenarios sin cambios de temperatura, facilitando además la visualización de la evolución de la demanda
en horizontes más amplios.
La solución se despliega en Azure con un pipeline de CI/CD, proporcionando alertas de rendimiento y garantizando tiempos de ejecución inferiores a 30 minutos. Los resultados confirman un enfoque escalable y eficaz, proporcionando a la comercializadora una solución sólida para la gestión diaria y la planificación
estratégica a largo plazo. The Master’s Thesis presents an integrated platform to predict a gas supplier’s daily consumption using machine learning, alongside a tool to support long-term forecasting. After automating the ingestion and cleaning of consumption, weather and holiday data, three models (ARIMA, CatBoost and LightGBM) are dynamically assembled, each optimized via grid-search, and combined through a weighted median based on historical accuracy.
To ensure continuity over horizons of up to seven days, both horizontal and vertical smoothing techniques are applied to dampen abrupt peaks. The resulting ensemble model achieves a median absolute percentage error (Median APE) of 7.13 % during the test week of June 1–7, 2025, with a median APE below 5 % in the first two days of the forecast horizon, thereby meeting the company’s operational requirements. Moreover, over the five-month evaluation period from January to May 2025, the model attained a median APE of 5.15 % after applying smoothing and stabilization procedures, demonstrating consistent daily predictions when the test set was expanded.
In addition, a short-term forecasting support tool was developed, whose goal is less to minimize any single error metric and more to provide demand scenarios under varying climatic assumptions. To this end, demand-temperature betas are estimated via segmented linear regressions by month and day-type, and consumption scenarios are generated for temperature variations of ±1, ±2 and ±3 °C, as well as for a “no-change” baseline. The tool also facilitates visualization of demand evolution over longer horizons.
The entire solution is deployed on Azure with a CI/CD pipeline, delivering performance alerts and ensuring execution times under 30 minutes. The results confirm a scalable, efficient approach that offers the supplier a robust solution for daily operations and long-term strategic planning.
Trabajo Fin de Máster
Desarrollo de herramienta completa de predicción a corto plazo de consumo de Gas de cartera de comercializadora usando herramientas de Aprendizaje AutomáticoTitulación / Programa
Máster Universitario en Big DataMaterias/ categorías / ODS
H0ZPalabras Clave
Gas, machine-learning, predicción, ensamblado, ARIMA, Catboost y LightGBMGas, machine learning, prediction, ensemble, ARIMA, CatBoost, LightGBM