Interpersonal Distance Monitoring Using Deep Learning and Computer Vision
Resumen
En estos tiempos extraños que estamos viviendo el último año y medio, mantener una distancia de seguridad entre las personas para evitar que Covid-19 se propague se ha convertido en una de las medidas más efectivas para controlar la pandemia. Dado que estamos en 2020 y la tecnología es ahora nuestra forma de entenderlo todo, para garantizar que todas estas medidas están siendo obedecidas por la población, necesitamos una forma de asegurarnos de que lo sean, y, dado que el número de personas que controlan es muy pequeño en comparación, es casi obligatorio utilizar todos los métodos de control “no oficiales” que disponemos, como cámaras ubicadas en todas las ciudades. Usando Machine Learning y el desarrollo reciente en Computer Vision, esto posiblemente se pueda hacer y, con suerte, que sea útil no solo por ahora, sino para otras situaciones futuras a las que nos podamos enfrentar. Después de entrenar diferentes modelos para la detección, seguimiento y estimación de distancia entre individuos, los resultados muestran que, con alguna mejora, este objetivo se puede lograr dentro de los límites del video en tiempo real. Para lograr estos resultados, se probaron tres versiones diferentes del algoritmo de última generación YOLO, luego se introdujeron en un algoritmo de seguimiento ampliamente utilizado como DeepSORT y, finalmente, para la parte de estimación de distancia, encontramos la necesidad de generar un conjunto de datos completamente sintético para alimentar los modelos con información de color y profundidad y ver si puede predecir la distancia entre los individuos generada con un simulador. Los resultados han demostrado ser exitosos, pero el camino por recorrer es largo y el margen de mejora es grande. In these weird times that we are living the last year and a half, keeping a safety distance between individuals to prevent Covid-19 from spreading has become one of the most effective measures to control de pandemic. Since we are in 2020 and technology is now our way of understanding everything, to ensure all these measures are being obeyed by the population, we need a way of making sure they are, and, since the number of people controlling is very small in comparison to the people that needs to be controlled, using all the “unofficial” controlling methods such as cameras located all over the cities is almost mandatory. Using Machine Learning and the recent development in Computer Vision this can possibly be handled and hopefully be useful not just for now, but for other future situations we may face. After training different models for detection, tracking and distance estimation between individuals, results show that, with some improvement, this objective can be achieved within the limits of real-time video. To achieve these results, three different versions of the state-of-the-art algorithm YOLO have been tested, then fed into a widely used tracking algorithm such as DeepSORT and finally, for the distance estimation part, we found the need of generating a completely synthetic dataset to feed color and depth information into a model and see if it can predict the distance between the individuals generated with a simulator. Results have proven to be successful, but the road ahead is long and the room for improvement is big.
Trabajo Fin de Máster
Interpersonal Distance Monitoring Using Deep Learning and Computer VisionTitulación / Programa
Máster Universitario en Ingeniería de TelecomunicaciónMaterias/ UNESCO
33 Ciencias tecnológicas3304 Tecnología de los ordenadores
330413 Dispositivos de transmisión de datos
Materias/ categorías / ODS
M8APalabras Clave
Aprendizaje profundo, Visión por ordenador, Detección, tracking, Estimación de la distancia, Tiempo realDeep Learning, Computer Vision, Detection, Tracking, Distance Estimation, Real-Time