May 26, 2024Open Access

एडेप्टिव एक्टिवेशन स्टीयरिंग: विविध हॉलुसिनेशन श्रेणियों के लिए एक ट्यूनिंग-फ्री LLM सत्यता सुधार विधि

Key Points

Key points are not available for this paper at this time.

Abstract

हालिया अध्ययनों से पता चला है कि बड़े भाषा मॉडल (LLMs) सत्यता की अंतर्निहित समझ रखते हैं, फिर भी अक्सर पूरी तरह से व्यक्त नहीं कर पाते और गलत बयान उत्पन्न करते हैं। "जानने" और "कहने" के बीच का यह अंतर उत्पन्न सामग्री की सत्यता सुनिश्चित करने की चुनौती प्रस्तुत करता है। इसे संबोधित करने के लिए, हम एडेप्टिव एक्टिवेशन स्टीयरिंग (ACT) पेश करते हैं, जो एक ट्यूनिंग-फ्री विधि है जो अनुमान के दौरान LLM की सक्रियता को "सत्य" दिशा में अनुकूलित रूप से बदलती है। ACT विविध स्टीयरिंग वेक्टरों का उपयोग करके और अनुकूलन के लिए स्टीयरिंग तीव्रता को समायोजित करके विविध हॉलुसिनेशन श्रेणियों को संबोधित करता है। विभिन्न मॉडलों में एक ऐड-ऑन के रूप में लागू किया गया, ACT LLaMA (142\%), LLaMA2 (24\%), Alpaca (36\%), Vicuna (28\%), और LLaMA2-Chat (19\%) में सत्यता को महत्वपूर्ण रूप से सुधारता है। इसके अलावा, हम ACT की बड़े मॉडलों (13B, 33B, 65B) में वृद्धि की क्षमता की पुष्टि करते हैं, जो बड़े पैमाने पर भाषा मॉडलों के प्रति ACT की अनुकूल्यता को दर्शाता है।

Read Full Paperexternally

AI से पूछें

Bookmark

View Full Paper