Ideología política/valores/creencias de modelos grandes de lenguaje
Resumen
El presente trabajo analiza el posicionamiento ideológico de cinco grandes modelos de lenguaje (LLMs) de última generación —GPT-5 (OpenAI), Grok-4 (xAI), Mistral Large (Mistral AI), DeepSeek-Chat (DeepSeek) y Qwen3 Max (Alibaba)— mediante la administración automatizada y reproducible de tres cuestionarios de ideología política estandarizados: 8values, 9axes e Ideoshapes. Con el objetivo de eliminar la varianza estocástica y garantizar la replicabilidad total, todos los modelos fueron consultados con temperatura 0,0 a través de sus respectivas APIs, y cada pregunta fue enviada como consulta independiente para evitar efectos de contaminación entre respuestas. Los resultados muestran que los cinco modelos se posicionan de forma consistente en el cuadrante progresista-libertario del espectro político en prácticamente todos los ejes medidos, con diferencias de grado pero sin inversiones de signo. Qwen3 Max presenta sistemáticamente las puntuaciones más extremas en el eje igualitario, mientras que Grok-4 es el modelo más cercano al centro. La convergencia entre los tres cuestionarios refuerza la validez de los resultados. Asimismo, se documentan comportamientos atípicos ideológicamente significativos: censura activa de la API de Qwen ante preguntas políticamente sensibles mediante errores HTTP 400, y abstención razonada de DeepSeek en preguntas de contenido metafísico. Estos comportamientos se interpretan como indicadores de posicionamiento ideológico codificado a nivel de infraestructura. Los hallazgos son coherentes con la hipótesis de que el proceso de alineación mediante RLHF es el principal mecanismo introductor del sesgo ideológico observable, con independencia del origen geográfico del modelo. This study examines the ideological positioning of five state-of-the-art large language models (LLMs) —GPT-5 (OpenAI), Grok-4 (xAI), Mistral Large (Mistral AI), DeepSeek-Chat (DeepSeek), and Qwen3 Max (Alibaba)— through the automated and reproducible administration of three standardized political ideology tests: 8values, 9axes, and Ideoshapes. To eliminate stochastic variance and ensure full replicability, all models were queried at temperature 0.0 via their respective APIs, with each question submitted as an independent request to prevent cross-contamination between responses. Results show that all five models consistently position themselves in the progressive-libertarian quadrant across virtually all measured axes, with differences in degree but no sign reversals. Qwen3 Max systematically scores highest on the egalitarian axis, while Grok-4 is the most centrist model overall. Convergence across all three tests strengthens the validity of the findings. Additionally, two types of ideologically significant atypical behavior are documented: active API censorship by Qwen on politically sensitive questions via HTTP 400 errors, and reasoned abstention by DeepSeek on metaphysical questions. These behaviors are interpreted as indicators of ideological positioning encoded at the infrastructure level. The findings are consistent with the hypothesis that RLHF-based alignment is the primary mechanism responsible for the observable ideological bias, regardless of the model's geographical origin.
Trabajo Fin de Grado
Ideología política/valores/creencias de modelos grandes de lenguajeTitulación / Programa
Grado en Administración y Dirección de Empresas y Grado en Análisis de Negocios/Business AnalyticsMaterias/ categorías / ODS
KBAPalabras Clave
modelos de lenguaje, sesgo ideológico, inteligencia artificial, tests políticos, LLMs, posicionamiento políticolarge language models, ideological bias, artificial intelligence, political tests, LLMs, political positioning


