Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/98575
Título : Segmentación lookalike en clientes Movistar+
Autor : RUBIO. SÁNCHEZ, DAVID
Ruiz Lafuente, Nicolás
Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)
Fecha de publicación : 2025
Resumen : El presente Trabajo de Fin de Máster tiene como objetivo el diseño y despliegue de un sistema de segmentación lookalike orientado a clientes de la plataforma Movistar Plus+, perteneciente a Telefónica. El problema surge a raíz de una limitación estructural en el sistema actual de segmentación de marketing: este solo puede aplicarse a usuarios que han otorgado consentimiento expreso (opt-in) para el uso de datos sensibles, como su navegación web. Esta restricción, derivada de las normativas de privacidad del RGPD, deja fuera de las campañas personalizadas a una gran parte de la base de clientes. Para abordar esta situación, se propone un sistema alternativo basado en aprendizaje profundo, que aprende a estimar la similitud comportamental entre clientes utilizando únicamente variables procesadas bajo la base legal de interés legítimo. La arquitectura propuesta sigue un enfoque two-tower (modelo siamesa), entrenada sobre pares de usuarios del conjunto opt-in, utilizando como señal supervisada una métrica de similitud continua calculada a partir de la coincidencia entre sus segmentos de marketing. Una vez entrenado, el modelo permite inferir representaciones vectoriales (embeddings) de cualquier usuario, y a partir de ahí identificar usuarios no-opt-in similares a clientes ya segmentados mediante búsqueda de vecinos más cercanos (k-nearest neighbors). El sistema ha sido desarrollado e integrado en el ecosistema productivo de Telefónica, utilizando tecnologías como Databricks, PySpark, PyTorch y FAISS. Se ha prestado especial atención a la escalabilidad, la gobernanza del dato, y la compatibilidad con los procesos ya existentes de segmentación y activación de campañas. A nivel de resultados, el modelo ha mostrado un rendimiento aceptable tanto en la tarea de predicción de similitud como en la inferencia de segmentos, especialmente en los casos donde existe correlación entre los datos disponibles y los segmentos objetivo. Además, permite duplicar o incluso cuadruplicar el volumen de usuarios asignables a cada segmento, sin necesidad de solicitar nuevos consentimientos. Por todo ello, se concluye que este enfoque es una solución viable, extensible y alineada con los requisitos legales y operativos de la compañía.
This Master's Thesis addresses the design and deployment of a lookalike segmentation system for Movistar Plus+, the streaming and television platform operated by Telefónica. The motivation stems from a structural limitation in the current marketing segmentation pipeline, which can only be applied to users who have explicitly consented (opt-in) to the use of sensitive data—particularly web browsing information. Due to privacy regulations such as the GDPR, a large portion of the customer base cannot be segmented or targeted using the existing process. To overcome this constraint, we propose a deep learning system capable of estimating behavioral similarity between users using only data processed under legitimate interest. The model follows a two-tower (siamese) neural architecture, trained on opt-in user pairs using a continuous similarity label derived from their marketing segment overlap. Once trained, the system generates vector embeddings for any user and performs lookalike inference for non-opt-in by identifying the closest opt-in users via k-nearest neighbor search. The solution is fully implemented within Telefónica’s production environment, leveraging Databricks, PySpark, PyTorch, and FAISS. Special care has been taken to ensure scalability, cost efficiency, data governance, and compatibility with existing activation pipelines. From an evaluation standpoint, the model performs well on similarity regression and downstream segment inference, particularly for clusters that correlate well with the available features. Most importantly, it enables significant growth in segment coverage—often doubling or tripling the size of addressable audiences—without requiring additional user consent. These results demonstrate that the proposed framework offers a practical, privacy-compliant, and technically robust method for extending marketing segmentation at scale.
Descripción : Máster Universitario en Big Data
URI : http://hdl.handle.net/11531/98575
Aparece en las colecciones: TFG, TFM (temporales)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TFM-RuizLafuenteNicolas.pdfTrabajo Fin de Máster2,38 MBAdobe PDFVisualizar/Abrir     Request a copy
confirmacion_autoria.pdfAutorización186,61 kBAdobe PDFVisualizar/Abrir     Request a copy


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.