Generación de vídeos con IA a partir de descripciones (prompts) y fotografías como herramienta para recrear incidentes y accidentes potenciales de lesiones graves o fatales (PLGF)

Rodríguez Camacho, Enrique

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/108457

Título :	Generación de vídeos con IA a partir de descripciones (prompts) y fotografías como herramienta para recrear incidentes y accidentes potenciales de lesiones graves o fatales (PLGF)
Autor :	Esteve Florencio, Ana Rodríguez Camacho, Enrique Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)
Fecha de publicación :	2026
Resumen :	Este Trabajo de Fin de Grado presenta el diseño, implementación y validación de un portal web que automatiza la generación de vídeos formativos de prevención de riesgos laborales a partir de informes de accidentes en formato PDF, desarrollado en colaboración con UFD Distribución Eléctrica (Grupo Naturgy). El sistema se organiza en un backend basado en Django 5 y Celery, y un frontend en Next.js 16, comunicados mediante una API REST. El núcleo del sistema es un pipeline de inteligencia artificial compuesto por siete agentes especializados que cubren el análisis semántico del texto, la interpretación visual de imágenes del accidente, el razonamiento causal, la planificación narrativa del vídeo, la generación de fotogramas clave con FLUX.2 Pro, la síntesis de clips con Kling v2.1 y la composición final con subtítulos y pantallas de cierre. La comunicación entre agentes se formaliza mediante ocho schemas Pydantic v2 que actúan como contratos validados automáticamente, con un mecanismo de reintento guiado por error que permite al modelo corregir salidas malformadas. Un requisito de diseño central es la confidencialidad: un módulo de anonimización basado en doce expresiones regulares elimina toda información personal antes de que el texto llegue a cualquier modelo de IA externo. Además, las medidas preventivas mostradas en el vídeo derivan exclusivamente del catálogo oficial de causas de accidentes de UFD (47 entradas), garantizando trazabilidad jurídica. El sistema ha sido validado con informes reales de UFD, generando vídeos completos en aproximadamente 10–12 minutos con un coste de entre 0,74 y 1,79 dólares por vídeo, varios órdenes de magnitud por debajo de la producción audiovisual externalizada. Los resultados demuestran que la automatización de este proceso es técnicamente viable y económicamente justificada, abriendo la vía a su despliegue en la infraestructura Azure de UFD. This Bachelor's Thesis presents the design, implementation, and validation of a web portal that automates the generation of occupational risk prevention training videos from accident report PDFs, developed in collaboration with UFD Distribución Eléctrica (Grupo Naturgy). The system is organised into a backend built on Django 5 and Celery, and a frontend implemented in Next.js 16, communicating through a REST API. Its core is an artificial intelligence pipeline composed of seven specialised agents covering semantic text analysis, visual interpretation of accident images, causal reasoning, narrative video planning, keyframe generation with FLUX.2 Pro, clip synthesis with Kling v2.1, and final composition with subtitles and closing screens. Communication between agents is formalised through eight Pydantic v2 schemas that act as automatically validated contracts, complemented by an error-guided retry mechanism that allows the model to correct malformed outputs. A central design requirement is confidentiality: an anonymisation module based on twelve regular expression patterns removes all personal information before the text reaches any external AI model. In addition, the preventive measures shown in the video are derived exclusively from UFD's official accident causes catalogue (47 entries), ensuring legal traceability. The system has been validated with real UFD reports, generating complete videos in approximately 10–12 minutes at a cost of between $0.74 and $1.79 per video, several orders of magnitude below outsourced audiovisual production. The results demonstrate that automating this process is technically feasible and economically justified, paving the way for its deployment on UFD's Azure infrastructure.
Descripción :	Grado en Ingeniería Matemática e Inteligencia Artificial
URI :	http://hdl.handle.net/11531/108457
Aparece en las colecciones:	TFG, TFM (temporales)

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
TFG_RodriguezCamachoEnrique.pdf	Trabajo Fin de Grado	624,79 kB	Adobe PDF	Visualizar/Abrir Request a copy
Anexo_I_RodriguezCamachoEnrique.pdf	Autorización	293,58 kB	Adobe PDF	Visualizar/Abrir Request a copy

Mostrar el registro Dublin Core completo del ítem