Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/98044
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorBuero Viana, Juan Antonioes-ES
dc.contributor.authorJiménez Carmona, José Antonioes-ES
dc.contributor.otherUniversidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)es_ES
dc.date.accessioned2025-03-13T19:59:33Z-
dc.date.available2025-03-13T19:59:33Z-
dc.date.issued2025es_ES
dc.identifier.urihttp://hdl.handle.net/11531/98044-
dc.descriptionMáster Universitario en Big Dataes_ES
dc.description.abstractTeam Copilot es una aplicación de chatbot que tiene como objetivo ayudar a los miembros de un equipo a realizar su trabajo mediante la gestión de un conjunto de documentos PDF y respondiendo a preguntas sobre los documentos. La aplicación está escrita en Python y tiene una API basada en FastAPI con endpoints para autenticación, carga de documentos y realización de preguntas. La aplicación tiene un agente basado en LangGraph que gestiona los chats y utiliza un modelo de embeddings remoto de Voyage AI y un modelo LLM remoto de Anthropic. La aplicación utiliza las bibliotecas de Python PyMuPDF y PyTesseract para extraer el texto de los documentos PDF. PyMuPDF se utiliza para extraer texto plano e imágenes y PyTesseract se utiliza para extraer texto de las imágenes previamente extraídas a través de OCR (Reconocimiento Óptico de Caracteres). El texto extraído de cada documento se almacena en una base de datos PostgreSQL configurada como una base de datos vectorial con la extensión PgVector de PostgreSQL.es-ES
dc.description.abstractTeam Copilot is a chatbot application that aims to help the members of a team do their work by managing a set of PDF documents and replying to questions about the documents. The application is written in Python and has a FastAPI based API with endpoints for authentication, uploading documents and making questions. The application has a LangGraph based agent that manages the chats and uses a remote embedding model from Voyage AI and a remote LLM model from Anthropic. The application uses the PyMuPDF and PyTesseract Python libraries to extract the text of the PDF documents. PyMuPDF is used to extract plain text and images and PyTesseract is used to extract text from the previously extracted images through OCR (Optical Character Recognition). The extracted text of each document is stored in a PostgreSQL database configured as a vector database with the PgVector PostgreSQL extension.en-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoes-ESes_ES
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United Stateses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/es_ES
dc.subject.otherH0Zes_ES
dc.titleChatbot de Conocimiento Interno de un Equipo de Trabajoes_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.keywordsChatbot, Documento, PDF, API, FastAPI, LLMes-ES
dc.keywordsChatbot, Document, PDF, API, FastAPI, LLMen-GB
Aparece en las colecciones: TFG, TFM (temporales)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TFM - Jimenez Carmona, Jose Antonio.pdfTrabajo Fin de Máster6,93 MBAdobe PDFVisualizar/Abrir
declaracion_autoria_firmada.pdfAutorización71,26 kBAdobe PDFVisualizar/Abrir     Request a copy


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.