April 20, 2024Open Access

AdvLoRA: Adaptação Adversarial de Baixa Classificação de Modelos de Visão-Linguagem

Key Points

Key points are not available for this paper at this time.

Abstract

Modelos de Visão-Linguagem (VLMs) são uma técnica significativa para Inteligência Geral Artificial (AGI). Com o rápido crescimento da AGI, o problema de segurança se torna um dos desafios mais importantes para os VLMs. Neste artigo, por meio de extensos experimentos, demonstramos a vulnerabilidade dos métodos convencionais de adaptação para VLMs, que podem trazer riscos significativos de segurança. Além disso, à medida que o tamanho dos VLMs aumenta, a aplicação de técnicas convencionais de adaptação adversarial em VLMs resulta em altos custos computacionais. Para resolver esses problemas, propomos um método de adaptação adversarial eficiente em termos de parâmetros chamado AdvLoRA por Adaptação de Baixa Classificação. Primeiro, investigamos e revelamos a propriedade intrínseca de baixa classificação durante a adaptação adversarial para VLMs. Diferente do LoRA, melhoramos a eficiência e robustez da adaptação adversarial ao projetar um novo método de reparametrização baseado em agrupamento de parâmetros e alinhamento de parâmetros. Além disso, uma estratégia de atualização de parâmetros adaptativa é proposta para melhorar ainda mais a robustez. Com essas definições, nosso AdvLoRA proposto alivia os problemas de segurança do modelo e alto desperdício de recursos. Extensos experimentos demonstram a eficácia e eficiência do AdvLoRA.

Read Full Paperexternally

Perguntar à IA

Bookmark

View Full Paper

Cite This Study

Ji et al. (Sat,) estudaram esta questão.

synapsesocial.com/papers/68e6e511b6db643587660fb8 https://doi.org/https://doi.org/10.48550/arxiv.2404.13425

Also Consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

Perguntar à IA

Bookmark

View Full Paper