Análisis de los efectos producidos combinando diferentes fuentes de información en la recomendación de puntos de interés
Resumen
Los sistemas de recomendación son herramientas de software que utilizan diversos algoritmos y técnicas para generar sugerencias específicas para cada usuario. Estos sistemas están presentes en la amplia mayoría de las plataformas en línea, ya que brindan una experiencia personalizada al usuario. Por ejemplo, podemos encontrarlos en las plataformas de streaming de vídeo como Netflix, donde se utilizan para recomendar al usuario películas y series basadas en sus intereses.
En este trabajo de fin de grado, se ha realizado un estudio sobre el estado del arte de los sistemas de recomendación, centrándose en la recomendación sobre puntos de interés (POIs), la cual consiste en recomendar a un usuario lugares que visitar cuando llega a una nueva ciudad. Se ha diseñado un pipeline de recomendación que utiliza datos procedentes de las redes sociales basadas en localización (Foursquare y Yelp) para generar recomendaciones a los usuarios.
Se desarrollaron diferentes algoritmos de recomendación, entre ellos, el basado en vecinos próximos, el cual calcula la similitud entre usuarios o artículos para generar recomendaciones. Además de este, se implementaron otros enfoques que incorporaban datos como la popularidad de los POIs o la información geográfica del usuario.
En concreto, en este proyecto se han utilizado técnicas de dominio cruzado o cross-domain para analizar el impacto que tiene en las recomendaciones la inclusión de nuevas fuentes de datos. Se emplearon diversos algoritmos con el propósito de evaluar este impacto. Los resultados obtenidos revelaron un deterioro en términos de acierto y precisión, aunque se observó una mejora en términos de diversidad y novedad, reduciendo así el sesgo de popularidad que pudieran tener las recomendaciones. Recommender systems are software tools that use various algorithms and techniques to generate user-specific suggestions. These systems are present in the vast majority of online platforms, as they provide a personalized user experience. For example, we can find them in video streaming platforms such as Netflix, where they are used to recommend movies and series to the user based on their interests.
In this theisis project, a study has been conducted on the state of the art of recommender systems, focusing on the recommendation on points of interest (POIs), which consists of recommending a user places to visit when he/she arrives in a new city. A recommendation pipeline has been designed that uses data from location-based social networks (Foursquare and Yelp) to generate recommendations to users.
Different recommendation algorithms were developed, among them, the nearest neighbor algorithm, which calculates the similarity between users or items to generate recommendations. In addition to this, other approaches were implemented that incorporated data such as the popularity of POIs or the user's geographic information.
Specifically, cross-domain techniques were used in this project to analyze the impact of the inclusion of new data sources on recommendations. Several algorithms were used to evaluate this impact. The results obtained revealed a deterioration in terms of accuracy and precision, although an improvement was observed in terms of diversity and novelty, thus reducing the popularity bias that recommendations may have.
Trabajo Fin de Grado
Análisis de los efectos producidos combinando diferentes fuentes de información en la recomendación de puntos de interésTitulación / Programa
Grado en Ingeniería en Tecnologías de Telecomunicación y Grado en Análisis de Negocios/Business AnalyticsMaterias/ UNESCO
12 Matemáticas1203 Ciencias de los ordenadores
120304 Inteligencia artificial
Materias/ categorías / ODS
KTT (GITT)Palabras Clave
Sistemas de recomendación, Recomendación de puntos de interés, Redes sociales basadas en localización (LBSN), Dominio cruzadoRecommender systems, Point-of-interest recommendation, Location-based social networks (LBSN), Cross-domain