Key points are not available for this paper at this time.
हालिया अध्ययनों से पता चला है कि बड़े भाषा मॉडल (LLMs) सत्यता की अंतर्निहित समझ रखते हैं, फिर भी अक्सर पूरी तरह से व्यक्त नहीं कर पाते और गलत बयान उत्पन्न करते हैं। "जानने" और "कहने" के बीच का यह अंतर उत्पन्न सामग्री की सत्यता सुनिश्चित करने की चुनौती प्रस्तुत करता है। इसे संबोधित करने के लिए, हम एडेप्टिव एक्टिवेशन स्टीयरिंग (ACT) पेश करते हैं, जो एक ट्यूनिंग-फ्री विधि है जो अनुमान के दौरान LLM की सक्रियता को "सत्य" दिशा में अनुकूलित रूप से बदलती है। ACT विविध स्टीयरिंग वेक्टरों का उपयोग करके और अनुकूलन के लिए स्टीयरिंग तीव्रता को समायोजित करके विविध हॉलुसिनेशन श्रेणियों को संबोधित करता है। विभिन्न मॉडलों में एक ऐड-ऑन के रूप में लागू किया गया, ACT LLaMA (142\%), LLaMA2 (24\%), Alpaca (36\%), Vicuna (28\%), और LLaMA2-Chat (19\%) में सत्यता को महत्वपूर्ण रूप से सुधारता है। इसके अलावा, हम ACT की बड़े मॉडलों (13B, 33B, 65B) में वृद्धि की क्षमता की पुष्टि करते हैं, जो बड़े पैमाने पर भाषा मॉडलों के प्रति ACT की अनुकूल्यता को दर्शाता है।
वांग एट अल. (सन,) ने इस सवाल का अध्ययन किया।
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: