| dc.contributor.advisor | Martín-Corral Calvo, David | es-ES |
| dc.contributor.author | Begara Girón, María | es-ES |
| dc.contributor.other | Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI) | es_ES |
| dc.date.accessioned | 2025-10-01T08:35:15Z | |
| dc.date.available | 2025-10-01T08:35:15Z | |
| dc.date.issued | 2026 | es_ES |
| dc.identifier.uri | http://hdl.handle.net/11531/105732 | |
| dc.description | Grado en Ingeniería en Tecnologías de Telecomunicación | es_ES |
| dc.description.abstract | El phishing se ha consolidado como una de las amenazas más extendidas en el entorno digital, con más de 25.000 incidentes registrados en España en 2025.La creciente sofisticación de estos ataques, donde el 38% de los correos recopilados para el proyecto pasaron los filtros automáticos de los proveedores de correo, pone de manifiesto la necesidad de contar con una herramienta complementaria, centralizada y accesible.
En este contexto nace PhishGuard, una aplicación web de acceso libre y desplegada íntegramente en la nube. Esta herramienta cuenta con un modelo de detección que combina un clasificador de Regresión Logística sobre vectorización TF-IDF, que estima la probabilidad de que un mensaje sea phishing, con el modelo generativo LLaMA 3.3-70B, que transforma esa aproximación numérica en orientación personalizada y accionable para cualquier usuario, sin requerir conocimientos técnicos previos. La aplicación incorpora también orientación legal básica adaptada al marco normativo vigente en España y la Unión Europea.
El sistema alcanza un F1-score del 99,31% sobre el dataset de test. Su validación con un conjunto propio de 88 correos reales recopilados durante siete meses demuestra que el 92,2% de los mensajes de phishing son correctamente clasificados como riesgo medio o alto, confirmando su efectividad ante ataques actuales. Estos resultados respaldan la viabilidad de PhishGuard como herramienta complementaria a las soluciones existentes, orientada no solo a la detección del fraude, sino a concienciar y a proporcionar recursos suficientes al usuario para que pueda identificarlo por sí mismo. | es-ES |
| dc.description.abstract | Phishing has established itself as one of the most widespread threats in the digital landscape, with over 25,000 incidents recorded in Spain in 2025. The growing sophistication of these attacks, where 38% of the emails collected for the project bypassed providers' automatic spam filters, highlights the need for a complementary, centralised and accessible tool.
In this context, PhishGuard is a freely accessible web application deployed entirely in the cloud. Its detection model combines a Logistic Regression classifier over TF-IDF vectorization with the LLaMA 3.3-70B generative model. The ML model estimates the probability that a message is phishing; the LLM transforms that estimate into personalised, actionable guidance for any user, without requiring prior technical knowledge. The tool also incorporates basic legal guidance adapted to the regulatory framework in force in Spain and the European Union.
The system achieves an F1-score of 99.31% on the test dataset. Its validation on a proprietary set of 88 real emails collected over seven months demonstrates that 92.2% of phishing messages are correctly classified as medium or high risk, confirming its effectiveness against current attacks. These results support the viability of PhishGuard as a complementary tool to existing solutions, aimed not only at detecting fraud, but at empowering users to identify it on their own. | en-GB |
| dc.format.mimetype | application/pdf | es_ES |
| dc.language.iso | en-GB | es_ES |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 United States | es_ES |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | es_ES |
| dc.subject.other | KTT (GITT) | es_ES |
| dc.title | Desarrollo de una aplicación web para detección de mensajes de phishing | es_ES |
| dc.type | info:eu-repo/semantics/bachelorThesis | es_ES |
| dc.rights.accessRights | info:eu-repo/semantics/openAccess | es_ES |
| dc.keywords | phishing, aprendizaje automático, modelo de lenguaje de gran tamaño, ciberseguridad, detección de fraude, concienciación | es-ES |
| dc.keywords | phishing, machine learning, large language model, cibersecurity, fraud detection, security awareness | en-GB |