Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/83192
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorBoal Martín-Larrauri, Jaimees-ES
dc.contributor.advisorGüitta López, Lucíaes-ES
dc.contributor.authorBarril Rodríguez-Arana, Manueles-ES
dc.contributor.otherUniversidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)es_ES
dc.date.accessioned2023-09-15T17:37:04Z-
dc.date.available2023-09-15T17:37:04Z-
dc.date.issued2024es_ES
dc.identifier.urihttp://hdl.handle.net/11531/83192es_ES
dc.descriptionMáster Universitario en Ingeniería Industrial + Máster en Industria Conectada / in Smart Industryes_ES
dc.description.abstractEl proyecto tiene como objetivo crear una herramienta de visualización para resultados de entrenamiento y evaluación en aprendizaje por refuerzo. Esta herramienta busca mejorar la comprensión y análisis del comportamiento de agentes en entornos complejos, permitiendo a expertos identificar patrones, analizar errores y ajustar estrategias de aprendizaje. La herramienta está diseñada para ser accesible, personalizable, y capaz de almacenar experimentos históricos. Su arquitectura se compone de tres capas: presentación (React), lógica de gestión de servicios (API FastAPI) y datos (BBDD MySQL). La base de datos relacional está estructurada con entidades como Model, Environment, Training, y Test, entre otras, permitiendo gestionar la información necesaria para el entrenamiento y evaluación del agente. El backend, desarrollado con FastAPI y Python, gestiona la comunicación con la base de datos y ofrece servicios como carga y análisis de datos de entrenamientos. El frontend, implementado en React, ofrece una interfaz modular y accesible, permitiendo a los usuarios cargar datos, visualizar resúmenes y gráficos, y descargar información de entrenamientos específicos. Un caso de uso específico involucra el entrenamiento de un brazo robótico para alcanzar un cubo rojo, acumulando experiencia en millones de pasos. La herramienta permite guardar los entrenamientos para luego favorecer la evaluación del desempeño del agente y ajustar el modelo de entrenamiento. La herramienta es funcional y se sugiere su aplicación en otros casos de aprendizaje por refuerzo. Se destaca por su capacidad de cargar grandes volúmenes de datos rápidamente y ofrecer una experiencia de usuario eficiente. Se recomienda migrar la base de datos a la nube para mejorar la accesibilidad y continuar mejorando la interfaz de usuario para optimizar la usabilidad del sistema.es-ES
dc.description.abstractThe project's goal is to create a visualization tool for training and evaluation results in reinforcement learning. This tool aims to improve the understanding and analysis of agent behavior in complex environments, allowing experts to identify patterns, analyze errors, and adjust learning strategies. The tool is designed to be accessible, customizable, and capable of storing historical experiments. Its architecture consists of three layers: presentation (React), service management logic (FastAPI API), and data (MySQL database). The relational database is structured with entities such as Model, Environment, Training, and Test, among others, allowing the management of the information necessary for the training and evaluation of the agent. The backend, developed with FastAPI and Python, handles communication with the database and offers services such as data loading and training analysis. The frontend, implemented in React, provides a modular and accessible interface, allowing users to load data, visualize summaries and charts, and download information from specific training sessions. A specific use case involves training a robotic arm to reach a red cube, accumulating experience over millions of steps. The tool allows saving training sessions to later facilitate the evaluation of the agent's performance and adjust the training model. The tool is functional and is suggested for application in other reinforcement learning cases. It stands out for its ability to quickly load large volumes of data and offer an efficient user experience. It is recommended to migrate the database to the cloud to improve accessibility and continue enhancing the user interface to optimize the system's usability.en-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoes-ESes_ES
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United Stateses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/es_ES
dc.subject.otherH62-electronica (MII-N)es_ES
dc.titleDesarrollo de una herramienta de visualización de resultados para aplicaciones de aprendizaje por refuerzoes_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.keywordsmachine learning, aprendizaje por refuerzo, bases de datos, diseño conceptual, Reactes-ES
dc.keywordsmachine learning, reinforcement learning, databases, conceptual design, Reacten-GB
Aparece en las colecciones: H62-Trabajos Fin de Máster

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TFM_BarrilRodriguezArana,Manuel.pdfTrabajo Fin de Máster2,3 MBAdobe PDFVista previa
Visualizar/Abrir
Anexo_I_MB.pdfAutorización246,26 kBAdobe PDFVisualizar/Abrir     Request a copy


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.