Mostrar el registro sencillo del ítem

dc.contributor.advisorSopena Gilboy, Bernates-ES
dc.contributor.authorRamos Pugnaire, Juan Migueles-ES
dc.contributor.otherUniversidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)es_ES
dc.date.accessioned2023-05-30T18:08:17Z
dc.date.available2023-05-30T18:08:17Z
dc.date.issued2023es_ES
dc.identifier.urihttp://hdl.handle.net/11531/78532
dc.descriptionMáster en Big Data. Tecnología y Analítica Avanzada/Master in Big Data Technologies and Advanced Analyticses_ES
dc.description.abstractLa aplicación de técnicas de Data Augmentation en series temporales ha ganado un creciente interés en el ámbito del forecasting. En este Trabajo de Fin de Máster (TFM), se explorará el uso de diferentes métodos de Data Augmentation para mejorar la calidad y el rendimiento de los modelos de predicción aplicados a series temporales. El objetivo principal de este TFM es abordar el problema de la escasez de datos en series temporales, que a menudo dificulta la capacidad de los modelos de predicción para capturar patrones y realizar predicciones precisas. Data Augmentation, es decir, la generación de nuevos datos sintéticos a partir de los datos existentes se presenta como una estrategia prometedora para intentar solucionar este problema. En este trabajo, se emplearán tanto métodos sencillos como métodos complejos de Data Augmentation. Entre los métodos sencillos, se incluirán técnicas como Time Warping, Add Noise, Pooling y Convolve, que han demostrado ser efectivas en la generación de datos aumentados para series temporales. Estas técnicas se basan en conceptos simples como la adición de ruido aleatorio o la convolución. Además, se explorará el uso de un método más complejo, el Autoencoder, que se ha destacado en la literatura como una herramienta prometedora en Data Augmentation. El Autoencoder es una red neuronal que aprende a codificar y decodificar los datos de entrada, permitiendo así la generación de nuevos conjuntos de datos que conserven las características de los datos originales. La elección de estos métodos se basa en el uso y estudio previo en la literatura. Sin embargo, el objetivo de este TFM no se limita únicamente a la aplicación de estos métodos, sino también en evaluar su efectividad y comparar su rendimiento utilizando distintos modelos de regresión, como el Random Forest y el XGBoost. En resumen, este TFM tiene como objetivo principal la aplicación de métodos de Data Augmentation en series temporales, abarcando tanto métodos sencillos como complejos. Se busca mejorar la capacidad de predicción de los modelos de regresión utilizados en este contexto.es-ES
dc.description.abstractThe application of Data Augmentation techniques in time series has gained increasing interest in the field of forecasting. In this Master's Thesis, we will explore the use of different Data Augmentation methods to improve the quality and performance of prediction models applied to time series. The main objective of this thesis is to address the issue of data scarcity in time series, which often hinders the ability of prediction models to capture patterns and make accurate predictions. Data Augmentation, i.e., the generation of synthetic data from existing data, emerges as a promising strategy to tackle this problem. In this work, we will employ both simple and complex methods of Data Augmentation. Among the simple methods, techniques such as Time Warping, Add Noise, Pooling, and Convolve will be included, as they have demonstrated effectiveness in generating augmented data for time series. These techniques are based on simple concepts such as adding random noise or convolution. Furthermore, we will explore the use of a more complex method, the Autoencoder, which has been highlighted in the literature as a promising tool in Data Augmentation. The Autoencoder is a neural network that learns to encode and decode input data, thus enabling the generation of new datasets that preserve the characteristics of the original data. The selection of these methods is based on their usage and prior study in the literature. However, the objective of this TFM is not limited solely to the application of these methods, but also to evaluate their effectiveness and compare their performance using different regression models, such as Random Forest and XGBoost. In summary, the main objective of this TFM is the application of Data Augmentation methods in time series, encompassing both simple and complex approaches. The aim is to enhance the prediction capacity of the regression models used in this context.en-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoes-ESes_ES
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United Stateses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/es_ES
dc.subject33 Ciencias tecnológicases_ES
dc.subject3304 Tecnología de los ordenadoreses_ES
dc.subject330413 Dispositivos de transmisión de datoses_ES
dc.subject.otherM8Aes_ES
dc.titleData Augmentation for Time Serieses_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.keywordsData Augmentation, Kaggle, M5 Forecasting, Tsaug, Time Warping, Add Noise, Pooling, Convolve, Autoencoder, Random Forest, XGBoost, Optuna, Backtesting.es-ES
dc.keywordsData Augmentation, Kaggle, M5 Forecasting, Tsaug, Time Warping, Add Noise, Pooling, Convolve, Autoencoder, Random Forest, XGBoost, Optuna, Backtesting.en-GB


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivs 3.0 United States
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivs 3.0 United States