What type of study is this?

This is a Experimental Study study.

September 29, 2025Open Access

SteerConf: आत्मविश्वास उत्पन्न करने के लिए LLMs का संचालन

Key Points

SteerConf बड़े भाषा मॉडलों की विश्वसनीयता को उनके आत्मविश्वास स्कोर को कैलिब्रेट करके महत्वपूर्ण रूप से सुधारता है।
यह ढांचा एक अनूठी संचालन प्रॉम्प्ट रणनीति को पेश करता है जो आत्मविश्वास आउटपुट के दिशा को प्रभावी ढंग से मार्गदर्शित करता है।
प्रायोगिक परिणामों से पता चलता है कि SteerConf विभिन्न बेंचमार्क पर मौजूदा आत्मविश्वास कैलिब्रेशन विधियों की तुलना में बेहतर प्रदर्शन करता है।
यह दृष्टिकोण बिना अतिरिक्त प्रशिक्षण की आवश्यकता के कार्य करता है, जिससे यह वर्तमान बड़े भाषा मॉडलों के लिए उपयुक्त बनता है।

Abstract

बड़े भाषा मॉडल (LLMs) विभिन्न क्षेत्रों में प्रभावशाली प्रदर्शन करते हैं लेकिन अक्सर अत्यधिक आत्मविश्वास से ग्रस्त होते हैं, जो उनके महत्वपूर्ण अनुप्रयोगों में विश्वसनीयता को सीमित करता है। हम SteerConf का प्रस्ताव करते हैं, एक नवीन ढांचा जो प्रणालीबद्ध तरीके से LLMs के आत्मविश्वास स्कोर को नियंत्रित करता है ताकि उनकी कैलिब्रेशन और विश्वसनीयता में सुधार किया जा सके। SteerConf तीन प्रमुख घटक प्रस्तुत करता है: (1) एक संचालन प्रॉम्प्ट रणनीति जो LLMs को निर्दिष्ट दिशाओं (जैसे, संवेदनशील या आशावादी) में आत्मविश्वास स्कोर उत्पादन करने के लिए प्रॉम्प्ट्स का उपयोग करके मार्गदर्शन करती है; (2) एक संचालित आत्मविश्वास संगति माप जो कई संचालित आत्मविश्वासों के बीच संरेखण को मात्रात्मक बनाता है ताकि कैलिब्रेशन को बढ़ाया जा सके; और (3) एक संचालित आत्मविश्वास कैलिब्रेशन विधि जो संगति माप का उपयोग करके आत्मविश्वास स्कोर को एकत्र करती है और उत्तर चयन के लिए रैखिक क्वांटाइजेशन लागू करती है। SteerConf बिना अतिरिक्त प्रशिक्षण या फाइन-ट्यूनिंग के कार्य करता है, जिससे यह मौजूदा LLMs पर व्यापक रूप से लागू होता है। पेशेवर ज्ञान, सामान्य ज्ञान, नैतिकता, और तर्क कार्यों में सात बेंचमार्क पर उन्नत LLM मॉडल (GPT-3.5, LLaMA 3, GPT-4) का उपयोग करके प्रयोगों से यह दिखाया गया है कि SteerConf मौजूदा विधियों की तुलना में महत्वपूर्ण रूप से बेहतर प्रदर्शन करता है, अक्सर एक महत्वपूर्ण अंतर से। हमारे निष्कर्ष LLMs के आत्मविश्वास को संचालित करने की क्षमता को उजागर करते हैं ताकि उन्हें वास्तविक दुनिया के अनुप्रयोगों में सुरक्षित तैनाती के लिए अधिक विश्वसनीय बनाया जा सके।

Read Full Paperexternally

AI से पूछें

Bookmark

View Full Paper