What type of study is this?

This is a Quantitative Study study.

October 5, 2025Open Access

샘플 효율적인 차분 개인 정보 보호 미세 조정 위한 그래디언트 행렬 잡음 제거

Key Points

차분 개인 정보 보호 미세 조정에서 대규모 언어 모델의 샘플 효율성이 향상되었습니다.
제안된 방법은 그래디언트 잡음 제거를 통해 개인 정보 보호 보장을 유지하면서 훈련 시간을 개선합니다.
무작위 행렬 이론의 활용은 잡음이 있는 그래디언트에서 낮은 랭크 구조의 복원을 가능하게 합니다.
GLUE 작업에 RoBERTa에 적용된 우리의 기술은 현재의 최첨단 방법들보다 뛰어납니다.

Abstract

우리는 DP-SGD를 사용하여 대규모 언어 모델(LLM)의 차분 개인 정보 보호 미세 조정에서 샘플 효율성의 문제를 다룹니다. DP-SGD는 강력한 개인 정보 보호 보장을 제공하지만, 추가된 잡음은 그래디언트 행렬의 엔트로피를 상당히 증가시켜 낮은 랭크 구조를 방해하고 최적화를 느리게 합니다. 우리는 무작위 행렬 이론을 활용하여 그래디언트를 잡음 제거하고 낮은 랭크 구조를 복원하며 원래 신호와의 정렬을 개선하는 후처리 알고리즘을 제안합니다. GLUE 작업에 대한 RoBERTa의 DP-SGD 미세 조정에 적용할 때, 우리의 방법은 최적의 성능이 요구되지 않을 때 훈련 시간을 상당히 줄이며 최신 방법들에 비해 샘플 효율성을 향상시킵니다. 이 연구는 행렬 복구 기술이 개인 정보 보호 보장을 손상시키지 않으면서 개인 언어 모델 훈련의 유용성을 향상시킬 수 있음을 보여줍니다.

샘플 효율적인 차분 개인 정보 보호 미세 조정 위한 그래디언트 행렬 잡음 제거

Key Points

Abstract

Cite This Study