Show simple item record

dc.contributor.authorGarcía Martínez-Echevarría, Victoriaes-ES
dc.contributor.authorPalacios Hielscher, Rafaeles-ES
dc.contributor.authorLópez López, Gregorioes-ES
dc.date.accessioned2026-04-15T04:25:42Z
dc.date.available2026-04-15T04:25:42Z
dc.identifier.urihttp://hdl.handle.net/11531/109587
dc.description.abstractLa accesibilidad y el creciente realismo de los sistemas modernos de síntesis y conversión de voz han intensificado la necesidad de mecanismos fiables para detectar audios generados por Inteligencia Artificial en contextos conrequisitos críticos de seguridad. Este artículo analiza la detección automática de voz sintética en un entorno de duración controlada (2-4 segundos) mediante el reentrenamiento de dos sistemas de referencia del conjunto Logical Access del ASVspoof 2019 Challenge. El primero es una red convolucional residual entrenada como clasificador binario, mientras que el segundo adopta una estrategia de aprendizaje de una sola clase con arquitectura ResNet-18. Además, se comparan los resultados de un estudio de identificación realizado con usuarios a través de una plataforma web. Los resultados experimentales muestran que el enfoque de una sola clase generaliza mejor frente a ataques no vistos; en cambio, los humanos cometen más errores, especialmente ante voces sintéticas modernas de alta calidad.es-ES
dc.description.abstracten-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoes-ESes_ES
dc.rightses_ES
dc.rights.uries_ES
dc.titleDetección automática de audio generado por Inteligencia Artificiales_ES
dc.typeinfo:eu-repo/semantics/workingPaperes_ES
dc.description.versioninfo:eu-repo/semantics/draftes_ES
dc.rights.accessRightsinfo:eu-repo/semantics/restrictedAccesses_ES
dc.keywordsOne-class learning, detección de spoofing, deepfakes, redes neuronales convolucionales (CNNs), síntesis de audioes-ES
dc.keywordsen-GB


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record