Key points are not available for this paper at this time.
Consideramos que as abordagens existentes para a "segurança" e "alinhamento" da IA podem não estar utilizando as ferramentas, equipes ou abordagens mais eficazes. Sugerimos que uma abordagem alternativa e melhor para o problema pode ser tratar o alinhamento como um problema de ciência social, uma vez que as ciências sociais possuem um rico conjunto de modelos para entender e alinhar motivação e comportamento, muitos dos quais poderiam ser reaproveitados para problemas envolvendo modelos de IA, e enumeramos razões pelas quais isso é assim. Apresentamos uma abordagem de alinhamento alternativa informada por ferramentas de ciências sociais e caracterizada por três etapas: 1. definindo um resultado social positivo desejado para a colaboração humano/IA como o objetivo ou "Estrela do Norte"; 2. enquadrando corretamente conhecidos e desconhecidos; e 3. formando equipes diversas para investigar, observar e navegar pelos desafios emergentes em alinhamento.
Rostcheck et al. (Mon,) estudaram esta questão.