Advanced Models for Computer Vision

Huertas Collado, Miguel

dc.contributor.advisor	Güitta López, Lucía	es-ES
dc.contributor.advisor	López López, Álvaro Jesús	es-ES
dc.contributor.author	Huertas Collado, Miguel	es-ES
dc.contributor.other	Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)	es_ES
dc.date.accessioned	2020-06-10T14:20:16Z
dc.date.available		es_ES
dc.date.issued	2020	es_ES
dc.identifier.uri	http://hdl.handle.net/11531/46861
dc.description	Máster Universitario en Ingeniería Industrial + Máster en Industria Conectada/ Master in Smart Industry	es_ES
dc.description.abstract	El principal objetivo de este proyecto ha sido analizar y desarrollar distintos modelos de visión artificial, tanto en el ámbito de clasificación de imágenes como de reconocimiento de acciones en vídeos. Para ello, se han utilizado redes neuronales convolucionales, un tipo de red neuronal que permite implementar un gran número de capas y que tiene en el procesado de imágenes su principal aplicación. En lo referente a imágenes, se han estudiado los modelos de Faster-RCNN para clasificación mediante cajas, validando los resultados con el popular modelo de YOLO. A su vez, se ha entrenado un modelo U-Net para la segmentación de imágenes, analizando las diferencias entre ambos planteamientos, así como la influencia de los distintos parámetros que componen el modelo. Para terminar, se ha entrenado un modelo de vídeo, SlowFast Networks, para el reconocimiento de acciones, donde no solo se ha tratado de encontrar y localizar los objetos del vídeo, como en el caso anterior, si no de entender el contexto donde se desarrolla la acción. Los resultados obtenidos muestran el potencial de estos algoritmos, así como su posible integración en aplicaciones más complejas. La gran limitación a la hora de entrenar los modelos ha sido la disponibilidad de recursos (GPU); no obstante, esto ha llevado a una mayor optimización de las soluciones disponibles y el análisis de las mejoras para futuros desarrollos.	es-ES
dc.description.abstract	This project analyses and trains different computer vision algorithms, for both image classification and action recognition in videos. To do so, convolutional neural networks have been used, which are the state-of-the-art solution for image recognition, allowing the network to have very deep architectures. In terms of image classification, Faster-RCNN has been implemented for bounding box classification, validating the results with the widely-known YOLO algorithm. Moreover, U-Net has been trained for image segmentation, comparing both approaches and each model behaviour in terms of the parameters that shape the model. Finally, SlowFast Network has been trained for action recognition in video, where the algorithm has to focus in the context of the action, not only in the object and its localization, as in the previous case. Results have shown the potential of these algorithms, as well as their integration in more complex applications. The biggest limitation when training has been the computational requirements (GPU), always an issue in Deep Learning. However, these limitations have helped to explore the optimal solution for each task, considering each assignment individually.	en-GB
dc.format.mimetype	application/pdf	es_ES
dc.language.iso	en-GB	es_ES
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 United States	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	es_ES
dc.subject	33 Ciencias tecnológicas	es_ES
dc.subject	3304 Tecnología de los ordenadores	es_ES
dc.subject	330405 Sistemas de reconocimiento de caracteres	es_ES
dc.title	Advanced Models for Computer Vision	es_ES
dc.type	info:eu-repo/semantics/masterThesis	es_ES
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es_ES
dc.keywords	Visión artificial, Aprendizaje profundo, Redes neuronales convolucionales, Clasificación de imágenes, clasificación de vídeo, Reconocimiento de acciones	es-ES
dc.keywords	Computer Vision, Deep Learning, Convolutional Neural Networks, Image classification, Video classification, Action recognition	en-GB

Files in this item

Name:: TFM-HuertasCollado,Miguel.pdf
Size:: 6.710Mb
Format:: PDF
Description:: Trabajo Fin de Máster

View/Open

Name:: AnexoI_MiguelHuertas.pdf
Size:: 89.79Kb
Format:: PDF
Description:: Autorización

View/Open

This item appears in the following Collection(s)

H62-Trabajos Fin de Máster

Show simple item record

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States