Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/38274
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorBoal Martín-Larrauri, Jaimees-ES
dc.contributor.advisorLópez López, Álvaro Jesúses-ES
dc.contributor.authorLuque Bayón, Emmanueles-ES
dc.contributor.otherUniversidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)es_ES
dc.date.accessioned2019-07-11T13:48:23Z
dc.date.availablees_ES
dc.date.issued2020es_ES
dc.identifier.urihttp://hdl.handle.net/11531/38274
dc.descriptionGrado en Ingeniería en Tecnologías Industrialeses_ES
dc.description.abstractEl motivo principal que ha dado lugar al desarrollo de este proyecto ha sido que consideramos que la inteligencia artificial, y en concreto el aprendizaje por refuerzo, es el futuro en cuanto a la optimización de procesos y, ante la necesidad de lograr optimizar el control de nuestro robot virtual para las clases de laboratorio de ciertas asignaturas de ICAI, hemos decidido probar su eficacia en este proyecto. El proyecto se ha llevado a cabo inicialmente en el entorno de una máquina virtual de Linux sobre Windows mediante la plataforma de simulación de CoppeliaSim y programando el código de manera externa en Python. Posteriormente se realizó el cambio de entorno a Windows para mayor simplicidad. En cuanto al desarrollo del proyecto se ha comenzado por una primera fase de preparación del entorno y puesta a punto de las herramientas necesarias. Le ha seguido una fase de ajuste del control PD. Tras ella se ha procedido diseñar una versión preliminar del algoritmo de aprendizaje por refuerzo y el ajuste de los hiperparámetros. Finalmente y tras el cambio de entorno a Windows se ha obtenido una versión depurada y exitosa del algoritmo de aprendizaje por refuerzo. Tras ella se ha llevado a cabo un análisis en profundidad de los resultados y la elaboración de la correspondiente memoria. Como conclusión principal del proyecto es conveniente recalcar la enorme efectividad que ha resultado tener el método de aprendizaje por refuerzo a la hora de obtener una solución óptima para nuestro caso de estudio y frente a la solución aportada por el algoritmo de control convencional. Ha resultado sorprendente la enorme importancia del tamaño máximo de la memoria del robot para lograr un resultado exitoso. Se recomienda para futuros estudios poner cuidado en alcanzar siempre una política determinista que demuestre la eficacia del método.es-ES
dc.description.abstractThe main reason that has given rise to the development of this project has been that we consider that artificial intelligence, and specifically reinforcement learning, is the future in terms of process optimization and, given the need to optimize the control of Our virtual robot for the laboratory classes of certain ICAI subjects, we have decided to test its effectiveness in this project. The project was initially carried out in the environment of a Linux virtual machine on Windows using the CoppeliaSim simulation platform and programming the code externally in Python. Subsequently, the environment change to Windows was made for greater simplicity. As for the development of the project, a first phase of preparing the environment and fine-tuning the necessary tools has begun. This was followed by an adjustment phase of the PD control. After that, a preliminary version of the reinforcement learning algorithm and the adjustment of the hyperparameters were designed. Finally, after the change of environment to Windows, a refined and successful version of the reinforcement learning algorithm has been obtained. After it, an in-depth analysis of the results and the preparation of the corresponding report has been carried out. As the main conclusion of the project, it is convenient to emphasize the enormous effectiveness that the reinforcement learning method has proved to have in obtaining an optimal solution for our case study and compared to the solution provided by the conventional control algorithm. The enormous importance of the maximum memory size of the robot to achieve a successful result has been surprising. Care is recommended for future studies to always achieve a deterministic policy that demonstrates the effectiveness of the method.en-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoeses_ES
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United Stateses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/es_ES
dc.subject12 Matemáticases_ES
dc.subject1203 Ciencias de los ordenadoreses_ES
dc.titleDesarrollo de un sistema de navegación para un robot móvil usando aprendizaje por refuerzoes_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.keywordsRobot móvil, Navegación, Inteligencia artificial, Aprendizaje por refuerzo, Simulación, CoppeliaSim, Pythones-ES
dc.keywordsMobile Robot, Navigation, Artificial Intelligence, Reinforcement Learning, Simulation, CoppeliaSim, Pythonen-GB
Aparece en las colecciones: KTI-Trabajos Fin de Grado

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TFG - Luque Bayon, Emmanuel.pdfTrabajo Fin de Grado2,42 MBAdobe PDFVista previa
Visualizar/Abrir
Anexo I.pdfAutorización171,28 kBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.