Key points are not available for this paper at this time.
يتطلب التقييم والفهم المنهجي لنماذج رؤية الكمبيوتر تحت ظروف متنوعة كميات كبيرة من البيانات مع تسميات شاملة ومخصصة، الأمر الذي نادراً ما تلبي بيانات رؤية العالم الحقيقي احتياجاته. بينما توفر مولدات البيانات الاصطناعية الحالية بديلاً واعدًا، خاصة لمهام الذكاء الاصطناعي المجسد، فإنها غالبًا ما تقصر في مهام رؤية الكمبيوتر بسبب ضعف جودة الأصول والإضاءة، التنوع المحدود، والخصائص الفيزيائية غير الواقعية. نقدم مجموعة رؤية BEHAVIOR (BVS)، مجموعة من الأدوات والأصول لإنشاء بيانات اصطناعية مخصصة بالكامل للتقييم المنهجي لنماذج رؤية الكمبيوتر، استنادًا إلى معيار الذكاء الاصطناعي المجسد الجديد المطور، BEHAVIOR-1K. تدعم BVS عددًا كبيرًا من المعلمات القابلة للتعديل على مستوى المشهد (مثل الإضاءة، وضع الكائنات)، على مستوى الكائن (مثل تكوين المفاصل، والسمات مثل "مملوء" و"مطوي")، وعلى مستوى الكاميرا (مثل مجال الرؤية، وطول البؤرة). يمكن للباحثين تغيير هذه المعلمات بشكل تعسفي أثناء إنشاء البيانات لإجراء تجارب محكومة. نقدم ثلاثة سيناريوهات تطبيق مثال: تقييم منهجي لصلابة النماذج عبر محاور مختلفة للتحول في المجال، تقييم نماذج فهم المشهد على نفس مجموعة الصور، وتدريب وتقييم الانتقال من المحاكاة إلى الواقع لمهمة رؤية جديدة: توقع الحالة الأحادية والثنائية. موقع المشروع: https://behavior-vision-suite.github.io/
درس جي وآخرون (الأربعاء) هذا السؤال.