May 15, 2024Open Access

مجموعة رؤية BEHAVIOR: إنشاء مجموعات بيانات قابلة للتخصيص عبر المحاكاة

Key Points

Key points are not available for this paper at this time.

Abstract

يتطلب التقييم والفهم المنهجي لنماذج رؤية الكمبيوتر تحت ظروف متنوعة كميات كبيرة من البيانات مع تسميات شاملة ومخصصة، الأمر الذي نادراً ما تلبي بيانات رؤية العالم الحقيقي احتياجاته. بينما توفر مولدات البيانات الاصطناعية الحالية بديلاً واعدًا، خاصة لمهام الذكاء الاصطناعي المجسد، فإنها غالبًا ما تقصر في مهام رؤية الكمبيوتر بسبب ضعف جودة الأصول والإضاءة، التنوع المحدود، والخصائص الفيزيائية غير الواقعية. نقدم مجموعة رؤية BEHAVIOR (BVS)، مجموعة من الأدوات والأصول لإنشاء بيانات اصطناعية مخصصة بالكامل للتقييم المنهجي لنماذج رؤية الكمبيوتر، استنادًا إلى معيار الذكاء الاصطناعي المجسد الجديد المطور، BEHAVIOR-1K. تدعم BVS عددًا كبيرًا من المعلمات القابلة للتعديل على مستوى المشهد (مثل الإضاءة، وضع الكائنات)، على مستوى الكائن (مثل تكوين المفاصل، والسمات مثل "مملوء" و"مطوي")، وعلى مستوى الكاميرا (مثل مجال الرؤية، وطول البؤرة). يمكن للباحثين تغيير هذه المعلمات بشكل تعسفي أثناء إنشاء البيانات لإجراء تجارب محكومة. نقدم ثلاثة سيناريوهات تطبيق مثال: تقييم منهجي لصلابة النماذج عبر محاور مختلفة للتحول في المجال، تقييم نماذج فهم المشهد على نفس مجموعة الصور، وتدريب وتقييم الانتقال من المحاكاة إلى الواقع لمهمة رؤية جديدة: توقع الحالة الأحادية والثنائية. موقع المشروع: https://behavior-vision-suite.github.io/

Read Full Paperexternally

اسأل الذكاء الاصطناعي

Bookmark

View Full Paper