Key points are not available for this paper at this time.
يعد الكشف عن البيانات خارج التوزيع (OOD) أمرًا حاسمًا في تطبيقات التعلم الآلي المعتمدة على السلامة وقد تم دراسته بشكل مكثف. بينما ركزت الدراسات الحديثة بشكل أساسي على طرق المعتمد على المصنف، تأخرت الأبحاث المتعلقة بأساليب نموذج التوليد العميق (DGM) نسبيًا. يمكن أن يُعزى هذا التفاوت إلى ظاهرة محيرة: غالبًا ما تعطي نماذج التوليد العميقة احتمالات أعلى للمدخلات المعروفة (OOD) غير المعروفة مقارنةً ببيانات التدريب المعروفة. تركز هذه الورقة على تفسير الآلية الأساسية لهذه الظاهرة. نقترح فرضية مفادها أن الصور الأقل تعقيدًا تتركز في مناطق ذات كثافة عالية في الفضاء الكامن، مما يؤدي إلى تعيين احتمال أعلى في التدفق التطبيعي (NF). نقدم تجريبيًا إثباتًا لصلاحيتها لخمسة هياكل NF، ونخلص إلى أن احتمالاتهم غير موثوق بها. بالإضافة إلى ذلك، نظهر أن هذه المشكلة يمكن التخفيف منها من خلال اعتبار تعقيد الصورة متغيرًا مستقلًا. أخيرًا، نقدم أدلة على إمكانية تطبيق فرضيتنا في نموذج توليد آخر، PixelCNN++.
درس أوسادا وآخرون (الجمعة) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: