October 1, 2024

नैतिक ट्यूरिंग परीक्षण: नैतिक निर्णय-निर्माण में मानव-LLM संरेखण का मूल्यांकन

Key Points

Key points are not available for this paper at this time.

Abstract

जैसे-जैसे बड़े भाषा मॉडल (LLMs) समाज में अधिक एकीकृत होते जा रहे हैं, उनका मानव नैतिकता के साथ संरेखण महत्वपूर्ण होता जा रहा है। इस संरेखण को बेहतर समझने के लिए, हमने विभिन्न नैतिक परिदृश्यों पर मानव और LLM द्वारा उत्पन्न उत्तरों का एक बड़ा संग्रह बनाया। हमने मानव और LLM के नैतिक आकलनों में असंगति पाई; हालांकि दोनों LLM और मानव नैतिक रूप से जटिल उपयोगितावाद संबंधी दुविधाओं को अस्वीकार करने की प्रवृत्ति रखते थे, LLM व्यक्तिगत फ्रेमिंग के प्रति अधिक संवेदनशील थे। इसके बाद हमने 230 प्रतिभागियों सहित एक मात्रात्मक उपयोगकर्ता अध्ययन किया, जिन्होंने इन उत्तरों का मूल्यांकन इस आधार पर किया कि वे AI-जनित हैं या नहीं, और उन्होंने उत्तरों से उनकी सहमति का भी आकलन किया। मानव मूल्यांकनकर्ताओं ने नैतिक परिदृश्यों में LLM के आकलनों को अधिक पसंद किया, हालांकि एक व्यवस्थित एंटी-AI पूर्वाग्रह देखा गया: प्रतिभागी ऐसे निर्णयों से कम सहमत थे जिन्हें उन्होंने मशीन-जनित माना। सांख्यिकीय और NLP-आधारित विश्लेषणों ने उत्तरों में सूक्ष्म भाषाई अंतर दिखाए, जो पहचान और सहमति को प्रभावित करते हैं। समग्र रूप से, हमारे निष्कर्ष नैतिक रूप से संवेदनशील निर्णय-निर्माण में मानव-AI धारणा की जटिलताओं को उजागर करते हैं।

AI से पूछें

Bookmark