May 6, 2024Open Access

O Elefante na Sala -- Por que a Segurança da IA Exige Equipes Diversas

Key Points

Key points are not available for this paper at this time.

Abstract

Consideramos que as abordagens existentes para a "segurança" e "alinhamento" da IA podem não estar utilizando as ferramentas, equipes ou abordagens mais eficazes. Sugerimos que uma abordagem alternativa e melhor para o problema pode ser tratar o alinhamento como um problema de ciência social, uma vez que as ciências sociais possuem um rico conjunto de modelos para entender e alinhar motivação e comportamento, muitos dos quais poderiam ser reaproveitados para problemas envolvendo modelos de IA, e enumeramos razões pelas quais isso é assim. Apresentamos uma abordagem de alinhamento alternativa informada por ferramentas de ciências sociais e caracterizada por três etapas: 1. definindo um resultado social positivo desejado para a colaboração humano/IA como o objetivo ou "Estrela do Norte"; 2. enquadrando corretamente conhecidos e desconhecidos; e 3. formando equipes diversas para investigar, observar e navegar pelos desafios emergentes em alinhamento.

Read Full Paperexternally

Perguntar à IA

Bookmark

View Full Paper