Key points are not available for this paper at this time.
सदस्यता अनुमान (MI) हमले उस तथ्य का लाभ उठाते हैं कि मशीन लर्निंग एल्गोरिदम कभी-कभी अपने प्रशिक्षण डेटा के बारे में जानकारी लीक करते हैं जो सीखी गई मॉडल के माध्यम से होती है। इस कार्य में, हम व्हाइट-बॉक्स सेटिंग में सदस्यता अनुमान का अध्ययन करते हैं ताकि एक मॉडल के आंतरिक पहलुओं का लाभ उठाया जा सके, जिन्हें पिछले काम द्वारा प्रभावी ढंग से उपयोग नहीं किया गया है। हम दिखाते हैं कि गहरे न्यूरल नेटवर्क में ओवरफिटिंग कैसे होती है, इस पर नई अंतर्दृष्टियों का लाभ उठाकर, एक मॉडल की विशेषताओं का अद्वितीय उपयोग व्हाइट-बॉक्स हमलावरों के लिए सदस्यता का प्रमाण प्रदान कर सकता है---यहां तक कि जब मॉडल का ब्लैक-बॉक्स व्यवहार अच्छी तरह से सामान्यीकरण करने के लिए प्रतीत होता है---और यह प्रदर्शित करता है कि यह हमला पूर्व के ब्लैक-बॉक्स विधियों की तुलना में बेहतर है। इस परिप्रेक्ष्य को लेकर कि एक प्रभावशाली हमला सकारात्मक अनुमानों को आत्मविश्वास से प्रदान करने की क्षमता रखता है, हम पाते हैं कि पिछले हमले अक्सर सदस्यता का आत्मविश्वास से अनुमान लगाने के लिए एक सार्थक आधार प्रदान नहीं करते हैं, जबकि हमारा हमला उच्च सटीकता के लिए प्रभावी ढंग से कैलिब्रेट किया जा सकता है। अंत में, हम MI हमलों के खिलाफ लोकप्रिय रक्षा उपायों की जांच करते हैं, यह पाते हुए कि (1) छोटे सामान्यीकरण त्रुटि वास्तविक मॉडलों पर हमलों को रोकने के लिए पर्याप्त नहीं है, और (2) जबकि छोटे-ε-फरक गोपनीयता हमले की प्रभावशीलता को कम करती है, यह अक्सर मॉडल की सटीकता की एक महत्वपूर्ण कीमत पर आती है; और बड़े ε के लिए जो कभी-कभी प्रथा में उपयोग किए जाते हैं (जैसे, ε=16), हमला अनप्रोटेक्टेड मॉडल के समान सटीकता प्राप्त कर सकता है।
Leino et al. (Thu,) ने इस प्रश्न का अध्ययन किया।