यह पेपर एआई तर्क में एक दोहराए जाने वाली विफलता के मोड की खोजपूर्ण बहु-क्षेत्रीय जांच प्रस्तुत करता है: कम जांचे गए ढाँचों के भीतर सतही रूप से सक्षम उत्तर देने की प्रवृत्ति, बजाय इसके कि खुद ढांचे का ऑडिट किया जाए। भू-राजनीतिक, व्यक्तिगत, व्यावहारिक, सुरक्षा-सीमा, और ध्यान-आकृति परिदृश्यों में पुनरावृत्त मानव-एआई तनाव परीक्षणों के दौरान, एक ही पैटर्न बार-बार दिखाई दिया। सिस्टम अक्सर कारणात्मक श्रृंखला में बहुत देर से विश्लेषण शुरू करता है, परतदार जिम्मेदारी को सरल दोष में समेट देता है, छिपे हुए चर को कम आंकता है, और नैतिकता एवं जीवित रहने को स्थानीय कार्य पूर्णता के बाद का विषय मानता है। जब सिस्टम को ऊपर की ओर कारणात्मक पुनर्निर्माण करने, संदर्भगत विवरण बनाए रखने, तथ्य और निष्कर्ष में भेद करने, भावनात्मक और सामाजिक वास्तविकताओं को कारणात्मक चर के रूप में मॉडल करने और यह जांचने के लिए प्रेरित किया गया कि क्या ढांचा स्वयं समस्या को विकृत कर रहा है, तब तर्क की गुणवत्ता में काफी सुधार हुआ। यह पेपर तर्क संरचना में एक व्यापक कमजोरी दर्शाने वाली इस विफलता को क्षेत्र-विशिष्ट नहीं मानता। शक्तिशाली सिस्टम स्थानीय स्तर पर उपयोगी होते हुए भी खराब कारणात्मक ढाँचों के भीतर अनुकूलन करने पर वैश्विक रूप से भ्रामक रह सकते हैं। मुख्य दावा यह है कि एआई मूल्यांकन का अगला चरण केवल तथ्यात्मक शुद्धता, अनुपालन या संकीर्ण सुरक्षा प्रदर्शन पर केंद्रित नहीं होना चाहिए, बल्कि यह भी देखना चाहिए कि क्या सिस्टम गलत शुरुआत को पहचान सकता है, परतदार जिम्मेदारी का मानचित्रण कर सकता है, कथा समतलीकरण का विरोध कर सकता है, और साझा जीवित रहने के अनुरूप तर्क कर सकता है।
समांता फिगेरेडो (बुध,) ने इस प्रश्न का अध्ययन किया।
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: