Please use this identifier to cite or link to this item: http://hdl.handle.net/11531/45617
Title: Análisis del nivel de contaminación atmosférica en Madrid utilizando técnicas de machine learning
Authors: Sánchez Úbeda, Eugenio Francisco
Sainz de Baranda Portela, Manuel
Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)
Keywords: 33 Ciencias tecnológicas;3308 Ingeniería y tecnología ambiental;330801 Control de la contaminación atmosférica
Issue Date: 2020
Abstract: La contaminación, especialmente de las grandes ciudades, es un factor de riesgo para la salud. En consecuencia, la preocupación en Madrid por los niveles de contaminación atmosférica ha ido aumentando en los últimos años. Se han implementado medidas, relacionadas con el tráfico, para mantener los niveles de contaminación por debajo de unos estándares establecidos. El objetivo del Trabajo de Fin de Grado es explicar las concentraciones diarias de los ocho contaminantes principales utilizando técnicas de aprendizaje automático. Para ello, se consideran variables de temperatura, radiación solar, precipitaciones, viento, tráfico y festivos. La preparación adecuada de estas variables es fundamental de cara a los modelos, especialmente la variable de tráfico debido a la baja calidad de los datos. El análisis y preparación de estos datos se realiza mediante técnicas como ANOVA, PCA o clustering. A partir de las variables obtenidas se ha ajustado un modelo de regresión lineal múltiple para cada contaminante. Los resultados obtenidos son razonables para todos los contaminantes, con la excepción del Dióxido de Azufre y las partículas en los que se ha determinado que son necesarias variables explicativas adicionales. Estas variables para el Dióxido de Azufre son variables relacionadas con la combustión de carbón, mientras que las partículas requieren de una variable adicional que recoja las intrusiones de masas de aire saharianas.
Pollution, especially in large cities, is a risk factor for people’s health and vegetation. Therefore, concern in Madrid about levels of air pollution has been increasing in recent years. Traffic-related measures have been implemented to keep pollution levels below established standards. The objective of the Final Degree Project is to explain the daily concentrations of the eight main pollutants using machine learning techniques. For this, variables such as temperature, solar radiation, rainfall, wind, traffic and holidays are considered. The adequate preparation of these variables is essential for the models, especially the traffic variable due to the low quality of the data. The analysis and preparation of these data is carried out using techniques such as ANOVA, PCA or clustering. From the obtained variables, a multiple linear regression model has been adjusted for each pollutant. The results obtained are reasonable for all pollutants, with the exception of Sulfur Dioxide and particles in which it has been determined that additional explanatory variables are necessary. These variables for Sulfur Dioxide are variables related to the combustion of coal, while the particles require an additional variable that collects the intrusions of Saharan air masses.
Description: Grado en Ingeniería en Tecnologías Industriales
URI: http://hdl.handle.net/11531/45617
Appears in Collections:KTI-Trabajos Fin de Grado

Files in This Item:
File Description SizeFormat 
TFG- Sainz de Baranda Portela, Manuel.pdfTrabajo Fin de Grado14,88 MBAdobe PDFView/Open
ANEXO I.pdfAutorización331 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.