Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/11531/98725| Título : | Automatización del parseo de documentos PDF-XFA (XML Forms Architecture) y la posterior explotación analítica de su información |
| Autor : | Pérez Barajas, Manuel Catalán Criado, Ángel Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI) |
| Fecha de publicación : | 2025 |
| Resumen : | El objetivo de este proyecto es mostrar cómo con analítica de datos y conocimientos de ETL (Extract-Transform-Load) es posible no sólo automatizar tareas (y su consecuente ahorro) sino también poder acceder a la información/datos de una manera rápida y masiva, pudiendo así analizarla y explotarla.
En este proyecto se desarrollará el proceso de parseo de archivos PDF-XFA a un formato tabular, para su posterior uso y análisis. The objective of this project is to demonstrate how, with data analytics and ETL (Extract-Transform-Load) knowledge, it is possible not only to automate tasks (and consequently save time) but also to access information/data quickly and extensively, enabling analysis and exploitation. This project will develop the process of parsing PDF-XFA files into a tabular format for subsequent use and analysis. |
| Descripción : | Máster Universitario en Big Data |
| URI : | http://hdl.handle.net/11531/98725 |
| Aparece en las colecciones: | TFG, TFM (temporales) |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | |
|---|---|---|---|---|
| TFM - Catalan Criado, Angel.pdf | Trabajo Fin de Máster | 1,88 MB | Adobe PDF | Visualizar/Abrir |
| Anexo I - Catalan Criado, Angel.pdf | Autorización | 82,84 kB | Adobe PDF | Visualizar/Abrir Request a copy |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.