Recientemente, la investigación sobre sistemas multiagente basados en modelos de lenguaje a gran escala ha señalado la conformidad social como una limitación importante. Este fenómeno debilita la diversidad de las respuestas y obstaculiza la capacidad de los agentes individuales para pensar y razonar de manera independiente. Este estudio propone un marco de adaptador metacognitivo que ajusta las representaciones internas del LLM según el nivel de conformidad estimado externamente para mitigar este sesgo de conformidad. El marco se diseñó en torno a dos componentes. Primero, el predictor de conformidad externo estima el grado de alineación entre las respuestas independientes y las que surgen tras la exposición social, utilizando embeddings a nivel de oración. Segundo, el adaptador condicional interno se combina con la última capa del modelo transformador y ajusta las representaciones ocultas en función de la puntuación de conformidad predicha, lo que suprime la alineación excesiva de opiniones. A través de experimentos, se ha mostrado que el modelo al que se aplica el adaptador mantiene la naturalidad semántica de las respuestas mientras reduce significativamente la tendencia a seguir sin crítica las opiniones de otros agentes. Esto demuestra que se puede mitigar efectivamente el sesgo de conformidad en un entorno de discusión multiagente mediante un mecanismo de autorregulación metacognitiva, induciendo un razonamiento más autónomo e independiente, sin necesidad de volver a entrenar todo el modelo.
Yu et al. (Sun) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: