बड़े भाषा मॉडल (LLMs) विभिन्न क्षेत्रों में प्रभावशाली प्रदर्शन करते हैं लेकिन अक्सर अत्यधिक आत्मविश्वास से ग्रस्त होते हैं, जो उनके महत्वपूर्ण अनुप्रयोगों में विश्वसनीयता को सीमित करता है। हम SteerConf का प्रस्ताव करते हैं, एक नवीन ढांचा जो प्रणालीबद्ध तरीके से LLMs के आत्मविश्वास स्कोर को नियंत्रित करता है ताकि उनकी कैलिब्रेशन और विश्वसनीयता में सुधार किया जा सके। SteerConf तीन प्रमुख घटक प्रस्तुत करता है: (1) एक संचालन प्रॉम्प्ट रणनीति जो LLMs को निर्दिष्ट दिशाओं (जैसे, संवेदनशील या आशावादी) में आत्मविश्वास स्कोर उत्पादन करने के लिए प्रॉम्प्ट्स का उपयोग करके मार्गदर्शन करती है; (2) एक संचालित आत्मविश्वास संगति माप जो कई संचालित आत्मविश्वासों के बीच संरेखण को मात्रात्मक बनाता है ताकि कैलिब्रेशन को बढ़ाया जा सके; और (3) एक संचालित आत्मविश्वास कैलिब्रेशन विधि जो संगति माप का उपयोग करके आत्मविश्वास स्कोर को एकत्र करती है और उत्तर चयन के लिए रैखिक क्वांटाइजेशन लागू करती है। SteerConf बिना अतिरिक्त प्रशिक्षण या फाइन-ट्यूनिंग के कार्य करता है, जिससे यह मौजूदा LLMs पर व्यापक रूप से लागू होता है। पेशेवर ज्ञान, सामान्य ज्ञान, नैतिकता, और तर्क कार्यों में सात बेंचमार्क पर उन्नत LLM मॉडल (GPT-3.5, LLaMA 3, GPT-4) का उपयोग करके प्रयोगों से यह दिखाया गया है कि SteerConf मौजूदा विधियों की तुलना में महत्वपूर्ण रूप से बेहतर प्रदर्शन करता है, अक्सर एक महत्वपूर्ण अंतर से। हमारे निष्कर्ष LLMs के आत्मविश्वास को संचालित करने की क्षमता को उजागर करते हैं ताकि उन्हें वास्तविक दुनिया के अनुप्रयोगों में सुरक्षित तैनाती के लिए अधिक विश्वसनीय बनाया जा सके।
झोउ एट आल। (मंगल,) ने इस प्रश्न का अध्ययन किया।
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: