Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/11531/98055
Título : | Control de Calidad de la Información |
Autor : | López Arribas, Ana Hernández de la Calera, Claudia Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI) |
Fecha de publicación : | 2025 |
Resumen : | Este Trabajo Fin de Máster presenta el diseño e implementación de un sistema
automatizado para el control de calidad de los datos en los procesos ETL
de la empresa Redsys. En un entorno con millones de transacciones diarias, garantizar
la calidad de los datos resulta esencial para asegurar la fiabilidad de la
información y el correcto funcionamiento de los sistemas analíticos.
El sistema desarrollado evalúa de forma modular varias dimensiones de calidad,
como puntualidad, integridad y precisión, cada una orientada a controlar
distintos aspectos del dato. Para su implementación se han utilizado tecnologías
de procesamiento distribuido como Apache Spark, integradas con herramientas
corporativas del ecosistema tecnológico de la empresa.
Los resultados de las evaluaciones permiten generar alertas que facilitan
la detección temprana de errores y la resolución de incidencias. Este enfoque
automatizado, flexible y escalable mejora significativamente la supervisión de
los procesos de carga y contribuye a reforzar la gobernanza del dato en entornos
complejos. This Final Project presents the design and implementation of an automated data quality control system for ETL processes within the company Redsys. In an environment where millions of transactions are processed daily, ensuring data quality is essential to maintain the reliability of information and the proper operation of analytical systems. The developed system evaluates multiple dimensions of data quality—such as timeliness, integrity, and accuracy—each focused on monitoring specific aspects of the data. The implementation relies on distributed processing technologies like Apache Spark, integrated with corporate tools already in use within the company’s technology stack. Evaluation results are used to trigger alerts that support early error detection and incident resolution. This automated, scalable, and flexible approach significantly enhances process monitoring and contributes to stronger data governance in complex operational environments. |
Descripción : | Máster Universitario en Big Data |
URI : | http://hdl.handle.net/11531/98055 |
Aparece en las colecciones: | TFG, TFM (temporales) |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
TFM_ClaudiaHernandezdelaCalera.pdf | Trabajo Fin de Máster | 3,49 MB | Adobe PDF | Visualizar/Abrir Request a copy |
AnexoI.pdf | Autorización | 139,48 kB | Adobe PDF | Visualizar/Abrir Request a copy |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.