बड़े भाषा मॉडल (LLMs) तार्किक रूप से असंगत मतिभ्रम प्रदर्शित करते हैं जो समन्वित प्रतीत होते हैं लेकिन तर्क के सिद्धांतों का उल्लंघन करते हैं, हाल के अनुसंधान में कारणात्मक तर्क की क्षमताओं और ऐसे मतिभ्रमों के बीच विपरीत संबंध सुझाया गया है। हालांकि, LLMs में मौजूदा तर्क दृष्टिकोण, जैसे कि Chain-of-Thought (CoT) और इसके ग्राफ-आधारित संस्करण, भाषाई टोकन स्तर पर काम करते हैं बजाय इसके कि वे चर के बीच अंतर्निहित कारणात्मक संबंधों को मॉडल करें, जिससे ये सशर्त स्वतंत्रताओं को प्रस्तुत करने या कारणात्मक पहचान की धारणाओं को पूरा करने में असमर्थ होते हैं। इस अंतर को पाटने के लिए, हम परिचय करते हैं causal-DAG निर्माण और तर्क (CDCR-SFT), एक पर्यवेक्षित फाइन-ट्यूनिंग फ्रेमवर्क जो LLMs को स्पष्ट रूप से चर-स्तर पर निर्देशित चक्रीय-रहित ग्राफ (DAG) का निर्माण करने और फिर उस पर तर्क करने के लिए प्रशिक्षित करता है। इसके अतिरिक्त, हम 25,368 नमूनों (CausalDR) का एक डेटासेट प्रस्तुत करते हैं, जिसमें प्रत्येक नमूना एक इनपुट प्रश्न, स्पष्ट कारणात्मक DAG, ग्राफ-आधारित तर्क पथ और सत्यापित उत्तर शामिल है। आठ कार्यों पर चार LLMs पर किए गए प्रयोगों से पता चलता है कि CDCR-SFT कारणात्मक तर्क क्षमता को बढ़ाता है, जिसमें CLADDER पर 95.33% की अत्याधुनिक सटीकता प्राप्त हुई (जो पहली बार मानव प्रदर्शन 94.8% से बेहतर है) और HaluEval पर मतिभ्रम में 10% सुधार हुआ है। यह दर्शाता है कि LLMs में स्पष्ट कारणात्मक संरचना मॉडलिंग प्रभावी रूप से LLM आउटपुट में तार्किक असंगतियों को कम कर सकती है। कोड https://github.com/MrLYG/CDCR-SFT पर उपलब्ध है।
ली और अन्य (सन,) ने इस प्रश्न का अध्ययन किया।