Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/68678
Título : Comparación de modelos de Machine Learning para el gasto turístico tras el Covid-19
Autor : Calvo Pascual, Luis Ángel
Moreno Bastante, María
Universidad Pontificia Comillas, Facultad de Ciencias Económicas y Empresariales
Palabras clave : 53 Ciencias económicas;5312 Economía sectorial;531290 Economía sectorial: Turismo
Fecha de publicación : 2023
Resumen : En este trabajo se ha investigado la evolución del gasto turístico en los años 2019 y 2022 para conocer el impacto de la pandemia sobre esta variable y sobre el sector. Para ello, se ha analizado la variable gasto turístico extraída de encuestas de turismo como EGATUR, que toman como población de estudio turistas no residentes en el país. Se han empleado diferentes técnicas cuantitativas como feature selection donde se ha obtenido como resultado que no ha habido variación en los factores o variables más determinantes del gasto turístico de un periodo a otro. Dichas variables han sido el número de pernoctaciones, el país de procedencia y el medio de transporte. Por otro lado, se han construido a partir de estos resultados modelos de regresión y clasificación para predecir el gasto turístico. Como mejor modelo de regresión se ha obtenido un proceso gaussiano GPR, mientras que de los modelos de clasificación ninguno ha demostrado suficiente capacidad predictiva debido a un aparente desequilibrio en el volumen de observaciones durante el proceso de categorización de la variable. Como consecuencia, no se obtuvieron resultados concluyentes donde se pudiera distinguir una clara distribución para las categorías de gasto alto, medio y bajo, y por ello, se ha realizado un análisis complementario usando imbalance data para detectar el turismo de lujo. En este último análisis se ha obtenido como algoritmo que mejor modeliza los datos un XGBboost que ha mostrado una precisión del 65% al clasificar a los turistas de lujo.
This paper has investigated the evolution of tourism expenditure in the years 2019 and 2022 in order to know the impact of the pandemic on this variable and on the sector. For this purpose, we have analyzed the tourism expenditure variable extracted from tourism surveys such as EGATUR, which take non-resident tourists in the country as the study population. Different quantitative techniques have been used as feature selection where it has been obtained as a result that there has been no variation in the most determining factors or variables of tourist expenditure from one period to another. These variables were the number of overnight stays, the country of origin and the means of transport. On the other hand, regression and classification models have been constructed from these results to predict tourist spending. A Gaussian GPR process was obtained as the best regression model, while none of the classification models showed sufficient predictive capacity due to an apparent imbalance in the volume of observations during the process of categorizing the variable. As a consequence, no conclusive results were obtained where a clear distribution could be distinguished for the high, medium and low expenditure categories, and therefore, a complementary analysis has been carried out using imbalance data to detect luxury tourism. In this last analysis, an XGBboost algorithm has been obtained as the algorithm that best models the data, showing an accuracy of 65% and therefore a good capacity to classify luxury tourists.
Descripción : Grado en Administración y Dirección de Empresas y Grado en Análisis de Negocios/Business Analytics
URI : http://hdl.handle.net/11531/68678
Aparece en las colecciones: KE2-Trabajos Fin de Grado

Ficheros en este ítem:
Fichero Tamaño Formato  
TFG MORENO BASTANTE MARIA.pdf3,61 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.