February 24, 2024Open Access

GreenLLaMA: Uma Estrutura para Desintoxicação com Explicações

Key Points

Key points are not available for this paper at this time.

Abstract

Trabalhos anteriores sobre desintoxicação são dispersos no sentido de que não cobrem todos os aspectos da desintoxicação necessários em um cenário do mundo real. Notavelmente, trabalhos anteriores restringem a tarefa de desenvolver modelos de desintoxicação a apenas um subconjunto visto de plataformas, deixando a questão de como os modelos se comportariam em plataformas não vistas inexplorada. Além disso, esses trabalhos não abordam a não desintoxicabilidade, um fenômeno pelo qual o texto tóxico não pode ser desintoxicado sem alterar o significado. Propomos o GreenLLaMA, a primeira estrutura de desintoxicação abrangente de ponta a ponta, que tenta aliviar as limitações mencionadas. Primeiro, introduzimos um corpus pseudo-paralelo entre plataformas aplicando estratégias de processamento e geração de dados em múltiplas etapas aproveitando o ChatGPT. Em seguida, treinamos um conjunto de modelos de desintoxicação com nosso corpus entre plataformas. Mostramos que nossos modelos de desintoxicação superam o modelo SoTA treinado com corpus paralelo anotado por humanos. Além disso, introduzimos explicações para promover transparência e confiabilidade. O GreenLLaMA também oferece um detector de paráfrase exclusivo, especialmente dedicado à tarefa de desintoxicação, para lidar com os casos não desintoxicáveis. Por meio de análises experimentais, demonstramos a eficácia de nosso corpus entre plataformas e a robustez do GreenLLaMA contra toxicidade adversarial.

Read Full Paperexternally

Perguntar à IA

Bookmark

View Full Paper