Key points are not available for this paper at this time.
يعد جدول النقاط المتعددة للذكاء الاصطناعي (MAST) أداة قائمة مرجعية تهدف إلى إبلاغ تصميم وتقييم أنظمة الذكاء الاصطناعي الموثوقة بناءً على معايير الحرفية التحليلية لوكالة المخابرات الأمريكية. في هذه الدراسة، نستكشف ما إذا كان يمكن استخدام MAST للتفريق بين أنظمة دعم القرار المدعومة بالذكاء الاصطناعي ذات الثقة العالية والمنخفضة (AI-DSSs). يطرح تقييم الثقة في AI-DSSs تحديات أمام الباحثين والممارسين. تشمل هذه التحديات تحديد المكونات والقدرات والإمكانات الخاصة بهذه الأنظمة، والتي تعتمد العديد منها على خوارزميات التعلم العميق المعقدة التي تدفع أداء DSS وتمنع الفحص اليدوي الكامل. باستخدام MAST، قمنا بتطوير نموذجين تفاعليين لـ AI-DSS. أحدهما يحاكي مهمة التحقق من الهوية في عمليات الفحص الأمني، والآخر يحاكي نظام تلخيص النصوص للمساعدة في مهمة تحقيق. كانت لكل نموذج نسخة واحدة مصممة لتحقيق تصنيفات منخفضة من MAST، وأخرى مصممة لتحقيق تصنيفات عالية من MAST. افترضنا أن تصنيفات MAST ستكون مرتبطة بشكل إيجابي بتصنيفات الثقة لهذه الأنظمة. تم تجنيد ما مجموعه 177 خبيراً في الموضوع للتفاعل مع هذه الأنظمة وتقييمها. تُظهر النتائج بشكل عام تصنيفات MAST أعلى للمجموعات ذات التصنيفات العالية مقارنة بالمجموعات ذات التصنيفات المنخفضة، وأن مقاييس إدراك الثقة مرتبطة بشدة بتصنيفات MAST. نستنتج أن MAST يمكن أن يكون أداة مفيدة لتصميم وتقييم الأنظمة التي ستولد إدراكات للثقة، بما في ذلك لأنظمة AI-DSS التي قد تُستخدم لدعم مهام الفحص البصري أو تلخيص النصوص. ومع ذلك، قد لا تعني تصنيفات MAST الأعلى أداءً مشتركًا أعلى، ولا يزال الربط بين MAST والثقة المناسبة أو الموثوقية مسألة مفتوحة.
درس سلاحي وآخرون (جمعة) هذا السؤال.