September 28, 2025Open Access

El gen cultural de los grandes modelos de lenguaje: un estudio sobre el impacto del entrenamiento cruzado de corpus en los valores y sesgos del modelo

Puntos clave

GPT-4 exhibe valores individualistas con tendencias de baja distancia de poder, mientras que ERNIE Bot muestra valores colectivistas con mayores tendencias de distancia de poder.
Se encontraron diferencias estadísticamente significativas en las métricas de alineación cultural, con GPT-4 alineándose más estrechamente con USA y ERNIE Bot con China.
El análisis utilizó un Conjunto de Datos de Sonda Cultural para comparar respuestas basadas en dimensiones interculturales definidas.
Los hallazgos enfatizan la importancia de evaluaciones culturalmente conscientes para mitigar sesgos algorítmicos y hegemonía cultural.

Resumen

Los grandes modelos de lenguaje (LLMs) se despliegan globalmente, sin embargo, sus supuestos culturales y éticos subyacentes permanecen poco explorados. Proponemos la noción de un "gen cultural" -- una orientación sistemática de valores que los LLMs heredan de sus corpus de entrenamiento -- e introducimos un Conjunto de Datos de Sonda Cultural (CPD) con 200 indicaciones dirigidas a dos dimensiones clásicas interculturales: Individualismo-Colectivismo (IDV) y Distancia de Poder (PDI). Usando indicaciones estándar en zero-shot, comparamos un modelo centrado en Occidente (GPT-4) y un modelo centrado en Oriente (ERNIE Bot). La anotación humana muestra divergencia significativa y consistente en ambas dimensiones. GPT-4 exhibe tendencias individualistas y de baja distancia de poder (puntuación IDV aprox 1.21; puntuación PDI aprox -1.05), mientras que ERNIE Bot muestra tendencias colectivistas y mayor distancia de poder (IDV aprox -0.89; PDI aprox 0.76); las diferencias son estadísticamente significativas (p < 0.001). También calculamos un Índice de Alineación Cultural (CAI) frente a los puntajes nacionales de Hofstede y encontramos que GPT-4 se alinea más estrechamente con USA (por ejemplo, CAI IDV aprox 0.91; CAI PDI aprox 0.88) mientras que ERNIE Bot se alinea más con China (CAI IDV aprox 0.85; CAI PDI aprox 0.81). Análisis cualitativos de resolución de dilemas y juicios relacionados con autoridad ilustran cómo estas orientaciones aparecen en el razonamiento. Nuestros resultados apoyan la visión de que los LLMs funcionan como espejos estadísticos de sus corpus culturales y motivan evaluaciones y despliegues culturalmente conscientes para evitar la hegemonía cultural algorítmica.

Leer artículo completoexternamente

Preguntar a la IA

Me gusta

Guardar

Ver artículo completo