Los grandes modelos de lenguaje (LLMs) se despliegan globalmente, sin embargo, sus supuestos culturales y éticos subyacentes permanecen poco explorados. Proponemos la noción de un "gen cultural" -- una orientación sistemática de valores que los LLMs heredan de sus corpus de entrenamiento -- e introducimos un Conjunto de Datos de Sonda Cultural (CPD) con 200 indicaciones dirigidas a dos dimensiones clásicas interculturales: Individualismo-Colectivismo (IDV) y Distancia de Poder (PDI). Usando indicaciones estándar en zero-shot, comparamos un modelo centrado en Occidente (GPT-4) y un modelo centrado en Oriente (ERNIE Bot). La anotación humana muestra divergencia significativa y consistente en ambas dimensiones. GPT-4 exhibe tendencias individualistas y de baja distancia de poder (puntuación IDV aprox 1.21; puntuación PDI aprox -1.05), mientras que ERNIE Bot muestra tendencias colectivistas y mayor distancia de poder (IDV aprox -0.89; PDI aprox 0.76); las diferencias son estadísticamente significativas (p < 0.001). También calculamos un Índice de Alineación Cultural (CAI) frente a los puntajes nacionales de Hofstede y encontramos que GPT-4 se alinea más estrechamente con USA (por ejemplo, CAI IDV aprox 0.91; CAI PDI aprox 0.88) mientras que ERNIE Bot se alinea más con China (CAI IDV aprox 0.85; CAI PDI aprox 0.81). Análisis cualitativos de resolución de dilemas y juicios relacionados con autoridad ilustran cómo estas orientaciones aparecen en el razonamiento. Nuestros resultados apoyan la visión de que los LLMs funcionan como espejos estadísticos de sus corpus culturales y motivan evaluaciones y despliegues culturalmente conscientes para evitar la hegemonía cultural algorítmica.
Fenech-Borg et al. (Sun,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: