Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/52740
Título : Análisis masivo de informes médicos mediante técnicas de NLP
Autor : Contreras Bárcena, David
Rodríguez-Mon Barrera, Beltrán
Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)
Palabras clave : 33 Ciencias tecnológicas;3304 Tecnología de los ordenadores;330406 Arquitectura de ordenadores
Fecha de publicación : 2021
Resumen : Este proyecto supone la elaboración de una herramienta enfocada para los dominios de la salud y la biomedicina con el objetivo de integrar las novedosas técnicas del área del Procesamiento del Lenguaje Natural y la experiencia de los especialistas del sector, recogida dentro del metatesauro UMLS e integrada utilizando la aplicación MetaMap. El primer módulo del sistema desarrollado supone la limpieza de los datos no estructurados y estructuración en diversos apartados del histórico de los datos. Tras esto, se realiza la búsqueda de conceptos médicos y su familia semántica dentro de este área mediante la aplicación MetaMap y el metatesauros UMLS. Por último, el proyecto ofrece tres servicios básicos de apoyo a los profesionales: El primero de los servicios de la aplicación consta de la integración de un sistema de agrupación de los documentos mediante K-Means y Word Embeddings facilitando así la búsqueda de informes similares a uno en concreto. El segundo de los módulos ofrece un sistema de creación de resúmenes automáticos de cada apartado de los informes, mostrando así la información más importante recogida en un documento. Por último, la aplicación cuenta con un sistema de recomendación basado en filtros colaborativos y KNN sugiriendo acciones futuras posibles para llevar a cabo según el análisis del histórico de los datos.
The project's objective is the development of a tool focused on the health and biomedicine domains and aimed to integrate the new techniques in the area of Natural Language Processing (NLP) and the experience of specialists in the sector, collected within the UMLS metathesaurus and integrated using the MetaMap application. The first module of the developed system involves cleaning the unstructured data available and structuring it in various sections. After this, the search for medical concepts and their semantic family within this area is carried out using the MetaMap application and the UMLS metathesaurus. Finally, the project offers three basic support services to professionals: The first of the application services consists of the integration of a document clustering system using K-Means and Word Embeddings, thus facilitating the search for similar reports to a particular one. The second of the modules offers an automatic summarization service of each section of the reports, to show only the most important information collected in a document. Finally, the application has a recommendation system based on collaborative filters and KNN suggesting possible future actions to carry out according to the analysis of the historical data.
Descripción : Máster Universitario en Ingeniería de Telecomunicación
URI : http://hdl.handle.net/11531/52740
Aparece en las colecciones: H67-Trabajos Fin de Máster

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TFM - Rodriguez-Mon Barrera, Beltran.pdfTrabajo Fin de Máster2 MBAdobe PDFVista previa
Visualizar/Abrir
AnexoI.pdfAutorización22,49 kBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.