Key points are not available for this paper at this time.
यह लेख हमारे छठे भावनात्मक व्यवहार विश्लेषण में-इन-द-वाइल्ड (ABAW) प्रतियोगिता के परिणाम प्रस्तुत करता है। चेहरे के विश्लेषण की विश्वसनीयता में सुधार करने के लिए, हम पूर्व-प्रशिक्षित गहरे मॉडलों का उपयोग करने की संभावना का अध्ययन करते हैं जो न्यूरल नेटवर्क्स को डाउनस्ट्रीम कार्य के लिए फाइन-ट्यून करने की आवश्यकता के बिना विश्वसनीय भावनात्मक विशेषताएँ निकालते हैं। विशेष रूप से, हम MobileViT, MobileFaceNet, EfficientNet, और DDAMFN आर्किटेक्चर पर आधारित कई हल्के मॉडलों का परिचय देते हैं जो स्थैतिक फोटो पर चेहरे के भाव, वैलेंस, और आंनद की पहचान करने के लिए बहु-कार्य परिदृश्यों में प्रशिक्षित किए गए हैं। ये न्यूरल नेटवर्क्स फ्रेम-स्तरीय विशेषताओं को सरल वर्गीकरणकर्ता में फीड करते हैं, जैसे कि रेखीय फीड-फॉरवर्ड न्यूरल नेटवर्क, भावनाओं की तीव्रता, यौगिक अभिव्यक्तियाँ, क्रियाकलाप इकाइयाँ, चेहरे के भाव, और वैलेंस/आंनद की भविष्यवाणी करने के लिए। छठे ABAW चुनौती से पांच कार्यों के लिए प्रयोगात्मक परिणाम दिखाते हैं कि हमारा दृष्टिकोण हमें मौजूदा गैर-एन्सेम्बल तकनीकों की तुलना में_validation सेट पर गुणवत्ता मीट्रिक में महत्वपूर्ण सुधार करने देता है।
आंद्रे वि. सावचेंको (मॉन,) ने इस प्रश्न का अध्ययन किया।