Algoritmos de clasificación y clustering para identificar la demanda de una compañía eléctrica y predecirla
Abstract
Gracias al Big Data, las empresas de diferentes industrias son capaces de caracterizar más precisamente el comportamiento de sus clientes. Siempre que se dispongan de una cantidad inmensa de datos, se pueden obtener patrones de comportamiento. Es aquí cuando se ve una aplicación interesante en el sector eléctrico español.
Los objetivos de este proyecto incluyen el desarrollo de una aplicación que permita la fácil comprensión de los datos, y la generación de un modelo predictivo para los clientes. De cierta manera, hacer una aplicación que sea fácil de utilizar para los departamentos de marketing de las diferentes empresas.
En este proyecto, se empieza transformando los datos para su posterior uso, ya sea añadiendo nuevos o transformando los existentes. Por ejemplo, se añade una tabla del INE para añadir la provincia y la autonomía de cada municipio. Después, se obtiene un número aproximado del número de grupos total, para después realizar la validación de modelos y clustering final. A continuación, se procede con la selección del modelo a partir de unos índices de validación interna. Por último, se realiza el proceso de clustering para la obtención de patrones de consumo.
Del proyecto se obtiene que el mejor algoritmo es KMeans, y que el modelo predictivo no es suficientemente valido ya que el índice empleado tiene un valor muy bajo. Thanks to Big Data, companies from different industries are those that most accurately characterize the behavior of their customers. Whenever an immense amount of data is available, patterns of behavior can be obtained. This is when you have an interesting application in the Spanish electricity sector.
The objectives of this project include the development of an application that allows an easy understanding of the data, and the generation of a predictive model for the clients. In a certain way, make an application easy to use for the marketing departments of the different companies.
In this project, you can transform the current data. For example, an INE table is added to add the province and the autonomy of each municipality. After that, we carry out the model validation and the final grouping. Then proceed with the selection of the model from internal validation indices. Finally, the grouping process is performed to obtain consumption patterns.
The project obtains that the best algorithm is KMeans, and that the predictive model is not valid enough since the employed index has a very low value.
Trabajo Fin de Grado
Algoritmos de clasificación y clustering para identificar la demanda de una compañía eléctrica y predecirlaTitulación / Programa
Grado en Ingeniería en Tecnologías de Telecomunicación y Grado en Administración y Dirección de EmpresasMaterias/ categorías / ODS
GITT (KTT)Palabras Clave
Big Data, electricidad, consumo, patrones, KMeansBig Data, electricity, consumption, patterns, KMeans