Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/98725
Título : Automatización del parseo de documentos PDF-XFA (XML Forms Architecture) y la posterior explotación analítica de su información
Autor : Pérez Barajas, Manuel
Catalán Criado, Ángel
Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)
Fecha de publicación : 2025
Resumen : El objetivo de este proyecto es mostrar cómo con analítica de datos y conocimientos de ETL (Extract-Transform-Load) es posible no sólo automatizar tareas (y su consecuente ahorro) sino también poder acceder a la información/datos de una manera rápida y masiva, pudiendo así analizarla y explotarla. En este proyecto se desarrollará el proceso de parseo de archivos PDF-XFA a un formato tabular, para su posterior uso y análisis.
The objective of this project is to demonstrate how, with data analytics and ETL (Extract-Transform-Load) knowledge, it is possible not only to automate tasks (and consequently save time) but also to access information/data quickly and extensively, enabling analysis and exploitation. This project will develop the process of parsing PDF-XFA files into a tabular format for subsequent use and analysis.
Descripción : Máster Universitario en Big Data
URI : http://hdl.handle.net/11531/98725
Aparece en las colecciones: TFG, TFM (temporales)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TFM - Catalan Criado, Angel.pdfTrabajo Fin de Máster1,88 MBAdobe PDFVisualizar/Abrir
Anexo I - Catalan Criado, Angel.pdfAutorización82,84 kBAdobe PDFVisualizar/Abrir     Request a copy


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.