Show simple item record

dc.contributor.advisorMartín-Corral Calvo, Davides-ES
dc.contributor.authorBegara Girón, Maríaes-ES
dc.contributor.otherUniversidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)es_ES
dc.date.accessioned2025-10-01T08:35:15Z
dc.date.available2025-10-01T08:35:15Z
dc.date.issued2026es_ES
dc.identifier.urihttp://hdl.handle.net/11531/105732
dc.descriptionGrado en Ingeniería en Tecnologías de Telecomunicaciónes_ES
dc.description.abstractEl phishing se ha consolidado como una de las amenazas más extendidas en el entorno digital, con más de 25.000 incidentes registrados en España en 2025.La creciente sofisticación de estos ataques, donde el 38% de los correos recopilados para el proyecto pasaron los filtros automáticos de los proveedores de correo, pone de manifiesto la necesidad de contar con una herramienta complementaria, centralizada y accesible. En este contexto nace PhishGuard, una aplicación web de acceso libre y desplegada íntegramente en la nube. Esta herramienta cuenta con un modelo de detección que combina un clasificador de Regresión Logística sobre vectorización TF-IDF, que estima la probabilidad de que un mensaje sea phishing, con el modelo generativo LLaMA 3.3-70B, que transforma esa aproximación numérica en orientación personalizada y accionable para cualquier usuario, sin requerir conocimientos técnicos previos. La aplicación incorpora también orientación legal básica adaptada al marco normativo vigente en España y la Unión Europea. El sistema alcanza un F1-score del 99,31% sobre el dataset de test. Su validación con un conjunto propio de 88 correos reales recopilados durante siete meses demuestra que el 92,2% de los mensajes de phishing son correctamente clasificados como riesgo medio o alto, confirmando su efectividad ante ataques actuales. Estos resultados respaldan la viabilidad de PhishGuard como herramienta complementaria a las soluciones existentes, orientada no solo a la detección del fraude, sino a concienciar y a proporcionar recursos suficientes al usuario para que pueda identificarlo por sí mismo.es-ES
dc.description.abstractPhishing has established itself as one of the most widespread threats in the digital landscape, with over 25,000 incidents recorded in Spain in 2025. The growing sophistication of these attacks, where 38% of the emails collected for the project bypassed providers' automatic spam filters, highlights the need for a complementary, centralised and accessible tool. In this context, PhishGuard is a freely accessible web application deployed entirely in the cloud. Its detection model combines a Logistic Regression classifier over TF-IDF vectorization with the LLaMA 3.3-70B generative model. The ML model estimates the probability that a message is phishing; the LLM transforms that estimate into personalised, actionable guidance for any user, without requiring prior technical knowledge. The tool also incorporates basic legal guidance adapted to the regulatory framework in force in Spain and the European Union. The system achieves an F1-score of 99.31% on the test dataset. Its validation on a proprietary set of 88 real emails collected over seven months demonstrates that 92.2% of phishing messages are correctly classified as medium or high risk, confirming its effectiveness against current attacks. These results support the viability of PhishGuard as a complementary tool to existing solutions, aimed not only at detecting fraud, but at empowering users to identify it on their own.en-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoen-GBes_ES
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United Stateses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/es_ES
dc.subject.otherKTT (GITT)es_ES
dc.titleDesarrollo de una aplicación web para detección de mensajes de phishinges_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.keywordsphishing, aprendizaje automático, modelo de lenguaje de gran tamaño, ciberseguridad, detección de fraude, concienciaciónes-ES
dc.keywordsphishing, machine learning, large language model, cibersecurity, fraud detection, security awarenessen-GB


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 United States
Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivs 3.0 United States