Desarrollo de una aplicación web para detección de mensajes de phishing

Begara Girón, María

dc.contributor.advisor	Martín-Corral Calvo, David	es-ES
dc.contributor.author	Begara Girón, María	es-ES
dc.contributor.other	Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)	es_ES
dc.date.accessioned	2025-10-01T08:35:15Z
dc.date.available	2025-10-01T08:35:15Z
dc.date.issued	2026	es_ES
dc.identifier.uri	http://hdl.handle.net/11531/105732
dc.description	Grado en Ingeniería en Tecnologías de Telecomunicación	es_ES
dc.description.abstract	El phishing se ha consolidado como una de las amenazas más extendidas en el entorno digital, con más de 25.000 incidentes registrados en España en 2025.La creciente sofisticación de estos ataques, donde el 38% de los correos recopilados para el proyecto pasaron los filtros automáticos de los proveedores de correo, pone de manifiesto la necesidad de contar con una herramienta complementaria, centralizada y accesible. En este contexto nace PhishGuard, una aplicación web de acceso libre y desplegada íntegramente en la nube. Esta herramienta cuenta con un modelo de detección que combina un clasificador de Regresión Logística sobre vectorización TF-IDF, que estima la probabilidad de que un mensaje sea phishing, con el modelo generativo LLaMA 3.3-70B, que transforma esa aproximación numérica en orientación personalizada y accionable para cualquier usuario, sin requerir conocimientos técnicos previos. La aplicación incorpora también orientación legal básica adaptada al marco normativo vigente en España y la Unión Europea. El sistema alcanza un F1-score del 99,31% sobre el dataset de test. Su validación con un conjunto propio de 88 correos reales recopilados durante siete meses demuestra que el 92,2% de los mensajes de phishing son correctamente clasificados como riesgo medio o alto, confirmando su efectividad ante ataques actuales. Estos resultados respaldan la viabilidad de PhishGuard como herramienta complementaria a las soluciones existentes, orientada no solo a la detección del fraude, sino a concienciar y a proporcionar recursos suficientes al usuario para que pueda identificarlo por sí mismo.	es-ES
dc.description.abstract	Phishing has established itself as one of the most widespread threats in the digital landscape, with over 25,000 incidents recorded in Spain in 2025. The growing sophistication of these attacks, where 38% of the emails collected for the project bypassed providers' automatic spam filters, highlights the need for a complementary, centralised and accessible tool. In this context, PhishGuard is a freely accessible web application deployed entirely in the cloud. Its detection model combines a Logistic Regression classifier over TF-IDF vectorization with the LLaMA 3.3-70B generative model. The ML model estimates the probability that a message is phishing; the LLM transforms that estimate into personalised, actionable guidance for any user, without requiring prior technical knowledge. The tool also incorporates basic legal guidance adapted to the regulatory framework in force in Spain and the European Union. The system achieves an F1-score of 99.31% on the test dataset. Its validation on a proprietary set of 88 real emails collected over seven months demonstrates that 92.2% of phishing messages are correctly classified as medium or high risk, confirming its effectiveness against current attacks. These results support the viability of PhishGuard as a complementary tool to existing solutions, aimed not only at detecting fraud, but at empowering users to identify it on their own.	en-GB
dc.format.mimetype	application/pdf	es_ES
dc.language.iso	en-GB	es_ES
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 United States	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/us/	es_ES
dc.subject.other	KTT (GITT)	es_ES
dc.title	Desarrollo de una aplicación web para detección de mensajes de phishing	es_ES
dc.type	info:eu-repo/semantics/bachelorThesis	es_ES
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es_ES
dc.keywords	phishing, aprendizaje automático, modelo de lenguaje de gran tamaño, ciberseguridad, detección de fraude, concienciación	es-ES
dc.keywords	phishing, machine learning, large language model, cibersecurity, fraud detection, security awareness	en-GB

Files in this item

Name:: TFG - Begara Girón María.pdf
Size:: 5.524Mb
Format:: PDF
Description:: Trabajo Fin de Grado

View/Open

Name:: Anexo I - Begara Girón, María.pdf
Size:: 412.0Kb
Format:: PDF
Description:: Autorización

View/Open

This item appears in the following Collection(s)

TFG, TFM (temporales)

Show simple item record

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States