Key points are not available for this paper at this time.
يمثل التعلم مع الملصقات المزعجة (LNL) تحدياً كبيراً لمجتمع التعلم الآلي. بعض من أكثر الأساليب استخداماً التي تختار كعينات نظيفة تلك التي يتمتع فيها النموذج نفسه (النموذج قيد التدريب) بثقة عالية، مثل `خسارة صغيرة`، يمكن أن تعاني من التحيز المعروف باسم `التأكيد الذاتي`. يحدث هذا التحيز لأن النموذج قيد التدريب، تم تدريبه جزئياً على الأقل على الملصقات المزعجة. علاوة على ذلك، في حالة التصنيف، يظهر تحدٍ إضافي لأن بعض الضوضاء في الملصقات تكون بين فئات متشابهة بصرياً جداً (`ضوضاء صعبة`). تعالج هذه الورقة هذه التحديات من خلال اقتراح طريقة (CLIPCleaner) تستفيد من CLIP، وهو نموذج قوي للرؤية-اللغة (VL) لبناء مصنف غير مشروط لاختيار عينات نظيفة بكفاءة، وبشكل غير متصل بالإنترنت. تتمثل فائدة ذلك في أن اختيار العينة منفصل عن النموذج قيد التدريب وأن اختيار العينة يأخذ في الاعتبار التشابهات الدلالية والبصرية بين الفئات بسبب طريقة تدريب CLIP. نقدم مبررات نظرية وأدلة تجريبية لإظهار مزايا CLIP لـ LNL مقارنة بالنماذج شبه المدربة التقليدية. مقارنة بالأساليب الحالية التي تجمع بين اختيار العينات التكرارية مع تقنيات متنوعة، يقدم CLIPCleaner نهجاً بسيطاً من خطوة واحدة يحقق أداءً تنافسياً أو متفوقاً على مجموعات البيانات المرجعية. على حد علمنا، هذه هي المرة الأولى التي يتم فيها استخدام نموذج VL لاختيار العينات لمواجهة مشكلة التعلم مع الملصقات المزعجة (LNL)، مما يبرز إمكانياتها في هذا المجال.
درس تشين وآخرون (السبت) هذا السؤال.