DESARROLLO DE UN ALGORITMO DE CLASIFICACIÓN DE FONDOS DE INVERSIÓN EN FUNCIÓN DE SUS CARACTERÍSTICAS - Fraile Lorenzo, José
Resumen
El aumento del número de fondos ha complicado la clasificación tradicional basada en etiquetas comerciales. Este trabajo construye un esquema multivariante que reagrupa 24.821 fondos en categorías internamente homogéneas. El proceso comienza con un flujo ETL reproducible. Posteriormente se aplica una reducción de dimensionalidad combinando PCA y UMAP, y sobre dicha representación se utiliza K-means con el objetivo de obtener el mejor compromiso entre cohesión interna y separación externa según los
índices de codo, Silhouette y Calinski-Harabasz. Los clústeres resultantes aportan una tipología objetiva que facilita el análisis comparativo y la construcción de carteras ajustadas al perfil riesgo-retorno. The rapid growth in the number of investment funds has undermined traditional labelbased classifications. This study develops a multivariate scheme that reorganises 24.821 European funds into internally homogeneous categories. The workflow begins with a reproducible ETL pipeline, followed by dimensionality reduction through a combination of PCA and UMAP. A K-means algorithm is then applied to the resulting embedding, selecting the number of clusters that offers the best trade-off between internal cohesion and external separation according to the elbow, Silhouette and Calinski-Harabasz indices. The resulting clusters yield an objective typology that streamlines comparative analysis and supports the construction of portfolios aligned with investors’ risk–return profiles.
Trabajo Fin de Grado
DESARROLLO DE UN ALGORITMO DE CLASIFICACIÓN DE FONDOS DE INVERSIÓN EN FUNCIÓN DE SUS CARACTERÍSTICAS - Fraile Lorenzo, JoséTitulación / Programa
Grado en Administración y Dirección de Empresas y Grado en Análisis de Negocios/Business AnalyticsMaterias/ categorías / ODS
KBAPalabras Clave
Fondos de inversión; clasificación automática; clustering; reducción de dimensionalidad; PCA; UMAP; K-means; flujo ETL.Investment funds; automated classification; clustering; dimensionality reduction; PCA; UMAP; K-means; ETL pipeline.