Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/11531/105545| Título : | ANÁLISIS COMPARATIVO DE TÉCNICAS DE APRENDIZAJE AUTOMÁTICO PARA LA DETECCIÓN DE TRANSACCIONES ILÍCITAS EN BITCOIN - De Gracia De Dios, Rodrigo |
| Autor : | Gago Rodríguez, Susana Josefa Gracia de Dios, Rodrigo de Universidad Pontificia Comillas, Facultad de Ciencias Económicas y Empresariales |
| Fecha de publicación : | 2026 |
| Resumen : | La detección de blanqueo de capitales en criptomonedas representa un reto creciente para los organismos reguladores, debido a características como la descentralización, el pseudoanonimato y el alcance global de estas redes. En este contexto, el presente trabajo implementa y compara siete modelos de aprendizaje automático para detectar transacciones ilícitas en la red de Bitcoin, cubriendo distintas familias de algoritmos: regresión logística, Random Forest, XGBoost, LightGBM, MLP, KNN e Isolation Forest.
El estudio se realiza sobre el dataset Elliptic, un conjunto de datos público y referente en la literatura, que presenta una fuerte asimetría entre clases (solo el 9,7% de las transacciones etiquetadas son ilícitas). Por ello, la métrica principal es el F1-score sobre la clase ilícita. Los resultados muestran que LightGBM con todas las variables obtiene el mejor rendimiento (F1 de 0,818), seguido muy de cerca por XGBoost y Random Forest. Además, todos los modelos sufren una caída drástica de rendimiento ante cambios bruscos en la distribución de los datos.
Se concluye que la detección automática de transacciones ilícitas es técnicamente viable con herramientas ampliamente disponibles, pero que su despliegue real debe priorizar la interpretabilidad y la escalabilidad frente a mejoras de rendimiento marginales. Por ello, se recomienda Random Forest como primera opción por su simplicidad e interpretabilidad, y LightGBM como segunda para entidades con mayor capacidad técnica. Money laundering detection in cryptocurrencies represents a growing challenge for regulatory bodies, due to characteristics such as the decentralization, pseudo-anonymity and global reach of these networks. In this context, the present work implements and compares seven machine learning models to detect illicit transactions in the Bitcoin network, covering different families of algorithms: logistic regression, Random Forest, XGBoost, LightGBM, MLP, KNN and Isolation Forest. The study is carried out on the Elliptic dataset, a public dataset and a benchmark in the literature, which presents a strong class imbalance (only 9.7% of the labeled transactions are illicit). For this reason, the main metric is the F1-score on the illicit class. The results show that LightGBM with all features obtains the best performance (F1 of 0.818), followed closely by XGBoost and Random Forest. Furthermore, all models suffer a drastic drop in performance when faced with abrupt changes in the data distribution. It is concluded that the automatic detection of illicit transactions is technically feasible with widely available tools, but that its real-world deployment must prioritize interpretability and scalability over marginal performance improvements. Therefore, Random Forest is recommended as the first option due to its simplicity and interpretability, and LightGBM as the second for entities with greater technical capacity. |
| Descripción : | Grado en Administración y Dirección de Empresas y Grado en Análisis de Negocios/Business Analytics |
| URI : | http://hdl.handle.net/11531/105545 |
| Aparece en las colecciones: | TFG, TFM (temporales) |
Ficheros en este ítem:
| Fichero | Tamaño | Formato | |
|---|---|---|---|
| TFG De Gracia De Dios Rodrigo.pdf | 1,18 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.