Mostrar el registro sencillo del ítem

dc.contributor.authorRodríguez Abella, Álvaroes-ES
dc.contributor.authorSilvestre, Joao Pedroes-ES
dc.contributor.authorTabuada, Pauloes-ES
dc.date.accessioned2026-05-18T13:34:55Z
dc.date.available2026-05-18T13:34:55Z
dc.date.issued2025-05-01es_ES
dc.identifier.issn2640-3498es_ES
dc.identifier.urihttp://hdl.handle.net/11531/110122
dc.descriptionArtículos en revistases_ES
dc.description.abstract.es-ES
dc.description.abstractA key component of transformers is the attention mechanism orchestrating how each token influences the propagation of every other token along the layers of a transformer. In this paper we provide a rigorous, mathematical analysis of the asymptotic properties of attention in transformers. Although we present several results based on different assumptions, all of them point to the same conclusion, all tokens asymptotically converge to each other, a phenomenon that has been empirically reported in the literature. Our findings are carefully compared with existing theoretical results and illustrated by simulations and experimental studies using the GPT-2 model.en-GB
dc.format.mimetypeapplication/pdfes_ES
dc.language.isoen-GBes_ES
dc.rightsCreative Commons Reconocimiento-NoComercial-SinObraDerivada Españaes_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/es_ES
dc.sourceRevista: Proceedings of Machine Learning Research, Periodo: 1, Volumen: , Número: 267, Página inicial: 174, Página final: 184es_ES
dc.titleConsensus is all you get: the role of attention in transformerses_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.description.versioninfo:eu-repo/semantics/publishedVersiones_ES
dc.rights.holderes_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.keywords.es-ES
dc.keywordstransformers; attention mechanism; token convergence; asymptotic analysis.en-GB


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

  • Artículos
    Artículos de revista, capítulos de libro y contribuciones en congresos publicadas.

Mostrar el registro sencillo del ítem

Creative Commons Reconocimiento-NoComercial-SinObraDerivada España
Excepto si se señala otra cosa, la licencia del ítem se describe como Creative Commons Reconocimiento-NoComercial-SinObraDerivada España