Generación de Datos Sintéticos mediante Redes Generativas Antagónicas (GANs). Aplicación al Mantenimiento Predictivo en Centrales de Generación de Energía Eléctrica.
Resumen
La generación de datos sintéticos mediante Redes Generativas Antagónicas (GANs), aplicada al mantenimiento predictivo en centrales de energía eléctrica, responde a uno de los principales desafíos que enfrenta la industria: la escasez de secuencias de fallos. Este déficit provoca un grave desbalanceo que limita severamente el entrenamiento de modelos centrados en la detección temprana de anomalías.
A lo largo del estudio, se implementan y comparan tres arquitecturas generativas (C-RNN-GAN, TimeGAN y Sig-Wasserstein GAN) para sintetizar secuencias multivariantes de sensores. Este enfoque metodológico se ha evaluado tanto sobre conjuntos de datos puramente sintéticos como sobre registros históricos reales obtenidos de una planta de generación eléctrica. Los resultados finales demuestran que es posible generar datos artificiales de alta calidad para equilibrar los conjuntos de entrenamiento.
Además se propone un marco de evaluación exhaustivo, adaptado a la compleja naturaleza de las relaciones en las series temporales, a partir de métricas de similitud estadística tradicionales (PCA, t-SNE, MMD, DTW) y enfoques más complejos. Como aporte de este proyecto a la comunidad científica, destaca la métrica de la respuesta impulsional aplicada a series temporales, la cual resulta muy útil para comprender cómo los modelos generativos logran capturar y preservar las complejas dinámicas físicas y causales subyacentes de los sensores temporales.
Finalmente, se han evaluado las secuencias generadas usando los paradigmas TRTS (Train on Real, Test on Synthetic) y TSTR (Train on Synthetic, Test on Real) que permiten obtener una aproximación a la viabilidad de usar datos sintéticos para desarrollar modelos más robustos y con una mayor capacidad de generalización. The generation of synthetic data using Generative Adversarial Networks (GANs), applied to predictive maintenance in electrical power plants, addresses one of the main challenges faced by the industry: the scarcity of fault sequences. This deficit causes a severe imbalance that heavily limits the training of models focused on early fault detection.
Throughout the study, three generative architectures (C-RNN-GAN, TimeGAN, and Sig-Wasserstein GAN) are implemented and compared to synthesize multivariate sensor sequences. This methodological approach has been evaluated on both purely synthetic datasets and real historical records obtained from a power generation plant. The final results demonstrate that it is possible to generate high-quality artificial data to balance the training datasets.
Furthermore, a comprehensive evaluation framework is proposed, tailored to the complex nature of relationships in time series, based on traditional statistical similarity metrics (PCA, t-SNE, MMD, DTW) and more complex approaches. As a contribution of this project to the scientific community, the impulse response metric applied to time series stands out, which proves highly useful for understanding how generative models successfully capture and preserve the complex underlying physical and causal dynamics in time series.
Finally, the generated sequences have been evaluated using the TRTS (Train on Real, Test on Synthetic) and TSTR (Train on Synthetic, Test on Real) paradigms, which provide an approximation of the viability of using synthetic data to develop more robust models with a greater generalization capacity.
Trabajo Fin de Máster
Generación de Datos Sintéticos mediante Redes Generativas Antagónicas (GANs). Aplicación al Mantenimiento Predictivo en Centrales de Generación de Energía Eléctrica.Titulación / Programa
Máster Universitario en Big DataMaterias/ categorías / ODS
H0ZPalabras Clave
Redes Generativas Antagónicas, Generación de datos sintéticos, Series temporales, Mantenimiento predictivo, Aumento de datos, Detección de anomalíasGenerative Adversarial Networks, Synthetic Data Generation, Time Series, Predictive Maintenance, Data Augmentation, Anomaly Detection


