September 28, 2025Open Access

कारणात्मक तर्क के माध्यम से बड़े भाषा मॉडलों में मतिभ्रम को कम करना

Key Points

CDCR-SFT ने मतिभ्रम को 10% कम किया और CLADDER पर 95.33% सटीकता प्राप्त की, जो मानव प्रदर्शन से बेहतर है।
प्रमुख परिणाम ने बड़े भाषा मॉडलों में कारणात्मक तर्क और मतिभ्रम के बीच महत्वपूर्ण विपरीत संबंध को उजागर किया।
कारणात्मक-DAG निर्माण और तर्क का उपयोग बड़े भाषा मॉडलों के आउटपुट में कारणात्मक समझ बढ़ाने के लिए किया गया।
निष्कर्षों से पता चलता है कि बेहतर कारणात्मक मॉडलिंग विधियाँ बड़े भाषा मॉडलों के आउटपुट में तार्किक असंगतियों को कम कर सकती हैं।

Abstract

बड़े भाषा मॉडल (LLMs) तार्किक रूप से असंगत मतिभ्रम प्रदर्शित करते हैं जो समन्वित प्रतीत होते हैं लेकिन तर्क के सिद्धांतों का उल्लंघन करते हैं, हाल के अनुसंधान में कारणात्मक तर्क की क्षमताओं और ऐसे मतिभ्रमों के बीच विपरीत संबंध सुझाया गया है। हालांकि, LLMs में मौजूदा तर्क दृष्टिकोण, जैसे कि Chain-of-Thought (CoT) और इसके ग्राफ-आधारित संस्करण, भाषाई टोकन स्तर पर काम करते हैं बजाय इसके कि वे चर के बीच अंतर्निहित कारणात्मक संबंधों को मॉडल करें, जिससे ये सशर्त स्वतंत्रताओं को प्रस्तुत करने या कारणात्मक पहचान की धारणाओं को पूरा करने में असमर्थ होते हैं। इस अंतर को पाटने के लिए, हम परिचय करते हैं causal-DAG निर्माण और तर्क (CDCR-SFT), एक पर्यवेक्षित फाइन-ट्यूनिंग फ्रेमवर्क जो LLMs को स्पष्ट रूप से चर-स्तर पर निर्देशित चक्रीय-रहित ग्राफ (DAG) का निर्माण करने और फिर उस पर तर्क करने के लिए प्रशिक्षित करता है। इसके अतिरिक्त, हम 25,368 नमूनों (CausalDR) का एक डेटासेट प्रस्तुत करते हैं, जिसमें प्रत्येक नमूना एक इनपुट प्रश्न, स्पष्ट कारणात्मक DAG, ग्राफ-आधारित तर्क पथ और सत्यापित उत्तर शामिल है। आठ कार्यों पर चार LLMs पर किए गए प्रयोगों से पता चलता है कि CDCR-SFT कारणात्मक तर्क क्षमता को बढ़ाता है, जिसमें CLADDER पर 95.33% की अत्याधुनिक सटीकता प्राप्त हुई (जो पहली बार मानव प्रदर्शन 94.8% से बेहतर है) और HaluEval पर मतिभ्रम में 10% सुधार हुआ है। यह दर्शाता है कि LLMs में स्पष्ट कारणात्मक संरचना मॉडलिंग प्रभावी रूप से LLM आउटपुट में तार्किक असंगतियों को कम कर सकती है। कोड https://github.com/MrLYG/CDCR-SFT पर उपलब्ध है।

कारणात्मक तर्क के माध्यम से बड़े भाषा मॉडलों में मतिभ्रम को कम करना

Key Points

Abstract

Cite This Study