Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/66766
Título : Reinforcement learning applied to a Universal Robot with a vacuum gripper
Autor : Juhel, Philippe
Burgos Madrigal, Álvaro
Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)
Palabras clave : 33 Ciencias tecnológicas;3311 Instrumentación tecnológica;331101 Tecnología de la automatización
Fecha de publicación : 2022
Resumen : En colaboración con la universidad ICAM, este proyecto aborda la problemática de enseñar a un robot con ventosa a mover un objeto de una caja a otra. La caja origen esta llena de objetos iguales. Se persigue que el robot identifique, de entre todos los puntos posibles, la mejor posición para colocar su ventosa y agarrar con una mayor probabilidad uno de los objetos. Una de las grandes dificultades del proyecto es que el algoritmo no posee información sobre el objeto, sobre la caja o sobre el entorno antes de empezar el entrenamiento. Únicamente tiene acceso a una una cámara de profundidad y una de color, por cada caja. Este proyecto parte de un proyecto ya comenzado en la universidad de ICAM, que utiliza un robot UR5 en su laboratorio y utiliza aprendizaje supervisado. En este proyecto se desarrollan dos módulos diferentes, que suponen posibles mejoras al actual estado del proyecto. La primera mejora se basa en la creación de un gemelo digital del laboratorio de la universidad, de forma que los algoritmos se puedan desarrollar en el mundo virtual y real, lo cual permite realizar pruebas de una forma más versátil. La segunda mejora que se construirá será un modelo de aprendizaje de refuerzo, basado en el actual modelo de aprendizaje supervisado, para obtener un algoritmo adaptable a cambios en el escenario, totalmente automático, y con una mejora continua. Por último, se realizará un análisis de sensibilidad para obtener los hiperparámetros óptimos del modelo y se compararán estos resultados óptimos con diferentes enfoques de muestreo del lote de experiencias utilizadas para el entrenamiento.
In collaboration with ICAM University, this project addresses the problem of teaching a robot with a vacuum gripper to move an object from one box to another. The original box is full of identical objects. The aim is for the robot to identify, among all possible points, the best position to place its vacuum gripper and grab one of the objects with the highest probability of pick. One of the great difficulties of the project is that the algorithm has no information about the object, the box or the environment before starting the training. It only has access to one depth camera and one color camera for each box. This project is part of a project already started at the University of ICAM, which uses a UR5 robot in its laboratory and uses supervised learning. In this project two different modules are developed, which represent possible improvements to the current state of the project. The first improvement is based on the creation of a digital twin of the university laboratory, so that algorithms can be developed in the virtual and real world, allowing testing in a more versatile way. The second improvement to be built will be a reinforcement learning model, based on the current supervised learning model, to obtain an algorithm adaptable to changes in the scenario, fully automatic, and with continuous improvement. Finally, a sensitivity analysis will be performed to obtain the optimal hyperparameters of the model and these optimal results will be compared with different sampling approaches of the batch of experiences used for training.
Descripción : Máster Universitario en Ingeniería Industrial + Máster en Industria Conectada / in Smart Industry
URI : http://hdl.handle.net/11531/66766
Aparece en las colecciones: H62-Trabajos Fin de Máster

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TFM-Alvaro-Burgos-Madrigal.pdfTrabajo Fin de Máster4,41 MBAdobe PDFVista previa
Visualizar/Abrir
AnexoI-Alvaro-Burgos-Madrigal.pdfAutorización58,33 kBAdobe PDFVista previa
Visualizar/Abrir     Request a copy


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.