Key points are not available for this paper at this time.
على الرغم من أن التعلم المُراقب يتطلب مجموعة بيانات مُعلمة، فإن الحصول على تسميات من الخبراء يعتبر عادة مكلفًا. لهذا السبب، تجذب خدمات crowdsourcing الانتباه في مجال تعلم الآلة كوسيلة لجمع التسميات بتكلفة منخفضة نسبيًا. ومع ذلك، غالبًا ما تكون التسميات التي يتم الحصول عليها من crowdsourcing، أي من العمال غير الخبراء، مليئة بالضجيج. لذلك تم وضع عدد من الأساليب لاستنتاج التسميات الحقيقية، وتم اقتراح عدة طرق لتعلم classifiers مباشرة من التسميات المستندة إلى crowdsourcing، والتي يُشار إليها باسم "التعلم من الحشود". مشكلة أكثر عملية هي التعلم من بيانات مُعلمة [العربية]/غير مُعلمة، أي "التعلم شبه المُراقب من الحشود". تقدم هذه الورقة نموذجًا مولّدًا مبتكرًا لعملية التسمية في crowdsourcing. يستفيد هذا النموذج من البيانات غير المُعلمة بفعالية من خلال إدخال ميزات خفية وتوزيع بيانات. بسبب تعقيد توزيع البيانات، نستخدم شبكة عصبية عميقة لتوزيع البيانات. لذا، يمكن اعتبار نموذجنا نوعًا من النماذج المولدة العميقة. تُحل المشاكل الناتجة عن عدم القدرة على معالجة posterior متغيرات خفية من خلال إدخال نموذج استدلال. تُظهر التجارب أنه يتفوق على أربعة نماذج موجودة، بما في ذلك نموذج أساسي، على مجموعة بيانات MNIST مع عمال تم محاكتهم ومجموعة بيانات مراجعة الأفلام من Rotten Tomatoes مع عمال Amazon Mechanical Turk.
أرادشي وآخرون (الأربعاء) درسوا هذا السؤال.