Desarrollo de Modelos de Predicción de Precios Inmobiliarios utilizando técnicas de Machine Learning
Resumen
En este trabajo de fin de grado se ha llevado a cabo una investigación exhaustiva sobre el estado actual del uso de técnicas de aprendizaje automático en el mercado inmobiliario, con un enfoque específico en la predicción de precios de venta de viviendas en Madrid. Se desarrollaron varios modelos de Machine Learning y Deep Learning utilizando datos obtenidos del portal inmobiliario Idealista.
La metodología seguida comienza con la extracción de datos a través de una API proporcionada por el portal mencionado, lo que garantizó la obtención de datos actualizados y relevantes. Estos datos se almacenaron en la nube para facilitar su acceso y gestión durante el proceso de análisis y modelado.
El análisis exploratorio de datos desempeñó un papel crucial en esta investigación, permitiendo una comprensión profunda de la naturaleza de los datos y la identificación de patrones significativos. Posteriormente, se procedió a la implementación de varios modelos de aprendizaje automático, utilizando bibliotecas de Python como scikit-learn para la regresión lineal y Random Forest, Xgboost para modelos de ensemble, y TensorFlow con Keras para modelos basados en redes neuronales.
Se llevó a cabo un ajuste de hiperparámetros para optimizar el rendimiento de los modelos y se utilizó la técnica de cross-validation para determinar su rendimiento real. La evaluación de los modelos se realizó utilizando métricas estándar en el campo, como el Mean Squared Error (MSE), Root Mean Squared Error (RMSE) y Mean Absolute Error (MAE), presentando los resultados basados en conjuntos de prueba.
Se observó que los modelos desarrollados demostraron una capacidad predictiva notable, con errores bajos, lo que sugiere su utilidad potencial en el mercado inmobiliario. Además de la evaluación de los modelos, se discuten posibles aplicaciones prácticas de los mismos en el contexto del mercado inmobiliario, como la identificación de oportunidades de inversión y la tasación automatizada de viviendas. In this final thesis, an exhaustive investigation was conducted on the current state of using machine learning techniques in the real estate market, with a specific focus on predicting housing sale prices in Madrid. Several machine learning and deep learning models were developed using data obtained from the Idealista real estate portal.
The methodology followed begins with data extraction through an API provided by the mentioned portal, ensuring the acquisition of updated and relevant data. These data were stored in the cloud to facilitate access and management during the analysis and modeling process.
Exploratory data analysis played a crucial role in this research, allowing for a deep understanding of the data nature and the identification of significant patterns. Subsequently, multiple machine learning models were implemented using Python libraries such as scikit-learn for linear regression and Random Forest, Xgboost for ensemble models, and TensorFlow with Keras for neural network-based models.
Hyperparameter tuning was performed to optimize the models' performance, and cross-validation technique was utilized to determine their real-world performance. Model evaluation was conducted using standard metrics in the field, such as Mean Squared Error (MSE), Root Mean Squared Error (RMSE), and Mean Absolute Error (MAE), presenting the results based on test sets.
It was observed that the developed models demonstrated remarkable predictive capability, with low errors, suggesting their potential utility in the real estate market. In addition to model evaluation, possible practical applications of the models in the real estate market, such as identifying investment opportunities and automated property valuation, were discussed.
Trabajo Fin de Grado
Desarrollo de Modelos de Predicción de Precios Inmobiliarios utilizando técnicas de Machine LearningTitulación / Programa
Grado en Ingeniería en Tecnologías de Telecomunicación y Grado en Análisis de Negocios/Business AnalyticsMaterias/ categorías / ODS
KBAPalabras Clave
Machine Learning, Mercado inmobiliario, Modelos de regresión, Tasación automatizada, Deep Learning, Aprendizaje supervisado, Analítica de datos, Métodos de ensemble.Machine Learning, Real Estate Market, Regression Models, Automated Valuation, Deep Learning, Supervised Learning, Data Analytics, Ensemble Methods.