Automatización del parseo de documentos PDF-XFA (XML Forms Architecture) y la posterior explotación analítica de su información
Resumen
El objetivo de este proyecto es mostrar cómo con analítica de datos y conocimientos de ETL (Extract-Transform-Load) es posible no sólo automatizar tareas (y su consecuente ahorro) sino también poder acceder a la información/datos de una manera rápida y masiva, pudiendo así analizarla y explotarla.
En este proyecto se desarrollará el proceso de parseo de archivos PDF-XFA a un formato tabular, para su posterior uso y análisis. The objective of this project is to demonstrate how, with data analytics and ETL (Extract-Transform-Load) knowledge, it is possible not only to automate tasks (and consequently save time) but also to access information/data quickly and extensively, enabling analysis and exploitation.
This project will develop the process of parsing PDF-XFA files into a tabular format for subsequent use and analysis.
Trabajo Fin de Máster
Automatización del parseo de documentos PDF-XFA (XML Forms Architecture) y la posterior explotación analítica de su informaciónTitulación / Programa
Máster Universitario en Big DataMaterias/ categorías / ODS
H0ZPalabras Clave
ETL, XML, PDF, PDF-XFA, parsear, análisis, XFAETL, XML, PDF, PDF-XFA, parser, analysis, XFA


