Unsupervised Learning for Condition Monitoring

Gómez Asensio, Álvaro

dc.contributor.advisor	Zah, Michael	es-ES
dc.contributor.author	Gómez Asensio, Álvaro	es-ES
dc.contributor.other	Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)	es_ES
dc.date.accessioned	2018-12-15T23:54:12Z
dc.date.available	2018-12-15T23:54:12Z
dc.date.issued	2019	es_ES
dc.identifier.uri	http://hdl.handle.net/11531/33878
dc.description	Máster Universitario en Ingeniería Industrial	es_ES
dc.description.abstract	El objetivo del proyecto es encontrar fallos de equipos en conjuntos de datos sin etiquetas mediante aprendizaje automático no supervisado utilizando los últimos métodos de reducción de dimensiones y clustering como UMAP y HDBSCAN. Para ello se empieza con un conjunto de datos obtenido simulando un banco de pruebas hidráulico en el que se producen muchos tipos de fallos en cuatro de sus componentes y después aplicamos los mismos métodos en un conjunto de datos real. El procedimiento es el siguiente, se reduce el número de dimensiones a dos (con PCA, UMAP y t-SNE) y después se utiliza un método de clustering (k-means o HDBSCAN) para separar en clusters los datos para después crear una hipótesis sobre cuál de los clusters representa los fallos en el quipo. PCA no consiguió representar correctamente ninguno de los dos conjuntos de datos porque producía pocos clusters para la cantidad de estados en los que el equipo podía estar. UMAP fue capaz de separar en más clusters y por tanto se podía distinguir mejor en que estado se encontraba el equipo. T-SNE obtuvo resultados muy similares a UMAP pero fue mucho más lento que éste. Los resultados tanto de k-means como de HDBSCAN fueron muy similares y concluimos que el mejor algoritmo para este caso era HDBSCAN por su facilidad de uso. En conclusión, la combinación de UMAP y HDBSCAN para el monitoreo de la condición resulta en un método más rápido y con unas mejores prestaciones que los métodos más tradicionales. Nuestra recomendación siempre será obtener la información de la etiqueta siempre que sea posible. De lo contrario, este método puede dar una buena idea de los datos e información que antes no era aparente, pero difícilmente puede ser usado como un método propio para detectar fallos y luego actuar dependiendo de sus hallazgos.	es-ES
dc.description.abstract	The aim of the project is to find equipment failures in unlabeled data sets by unsupervised automatic learning using the latest dimension reduction and clustering methods such as UMAP and HDBSCAN. This starts with a data set obtained by simulating a hydraulic test bench in which many types of failures occur in four of its components and then we apply the same methods in a real data set. The procedure is as follows, the number of dimensions is reduced to two (with PCA, UMAP and t-SNE) and then a clustering method (k-means or HDBSCAN) is used to separate the data into clusters and then create a hypothesis as to which of the clusters represents the failures in the equipment. PCA could not correctly represent either set of data because it produced few clusters for the number of states the team could be in. UMAP was able to separate into more clusters and therefore you could better distinguish what state the computer was in. T-SNE obtained results very similar to UMAP but much slower than UMAP. The results of both k-means and HDBSCAN were very similar and we concluded that the best algorithm for this case was HDBSCAN because of its ease of use. In conclusion, the combination of UMAP and HDBSCAN for condition monitoring results in a faster method with better performance than the more traditional methods. Our recommendation will always be to get the information from the label whenever possible. Otherwise, this method can give a good idea of data and information that was not previously apparent, but it can hardly be used as a method of its own to detect faults and then act upon its findings.	en-GB
dc.format.mimetype	application/pdf	es_ES
dc.language.iso	en-GB	es_ES
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 United States	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	es_ES
dc.subject.other	MII-N (H62-electronica)	es_ES
dc.title	Unsupervised Learning for Condition Monitoring	es_ES
dc.type	info:eu-repo/semantics/masterThesis	es_ES
dc.rights.accessRights	info:eu-repo/semantics/closedAccess	es_ES
dc.keywords	Aprendizaje automatico; Monitoreo condición; UMAP; HDBSCAN; no supervisado; clustering	es-ES
dc.keywords	Clustering; Unsupervised; HDBSCAN; UMAP; Dimension; Reduction	en-GB

Ficheros en el ítem

Nombre:: TFM-GomezAsensio,Alvaro.pdf
Tamaño:: 7.157Mb
Formato:: PDF
Descripción:: Trabajo Fin de Máster

Ver/

Nombre:: Anexo I.pdf
Tamaño:: 128.1Kb
Formato:: PDF
Descripción:: Autorización

Ver/

Este ítem aparece en la(s) siguiente(s) colección(ones)

H62-Trabajos Fin de Máster

Mostrar el registro sencillo del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivs 3.0 United States