Key points are not available for this paper at this time.
लार्ज लैंग्वेज मॉडल्स दिन-ब-दिन अधिक प्रमुख होते जा रहे हैं, जो यह संकेत भी देते हैं कि आर्टिफिशियल इंटेलिजेंस के अगले क्षेत्र के रूप में मल्टीमॉडलिटी की ओर बढ़ोतरी हो रही है, जहाँ उनके एम्बेडिंग्स को प्रॉम्प्ट के रूप में उपयोग करके टेक्स्टुअल कंटेंट उत्पन्न किया जाता है। विज़न-लैंग्वेज मॉडल्स (VLMs) इस प्रगति के अग्रिम पंक्ति में हैं, जो दृश्य और पाठ्य डेटा को जोड़ने के नवोन्मेषी तरीके प्रदान करते हैं ताकि बेहतर समझ और इंटरैक्शन हो सके। हालांकि, इस एकीकरण से हमले की सतह भी बढ़ जाती है। पैच-आधारित विरोधी हमला भौतिक विज़न अनुप्रयोगों में सबसे यथार्थवादी खतरे के मॉडल के रूप में माना जाता है, जैसा कि कई मौजूदा साहित्य में दिखाया गया है। इस पेपर में, हम पैच्ड विज़ुअल प्रॉम्प्ट इंजेक्शन को संबोधित करने का प्रस्ताव देते हैं, जहाँ विरोधी पैचों का उपयोग करके VLMs में लक्षित सामग्री उत्पन्न की जाती है। हमारे अध्ययन से पता चलता है कि पैच्ड विरोधी प्रॉम्प्ट पिक्सेल-वार यादृच्छिकता के प्रति संवेदनशील होते हैं, एक ऐसा गुण जो ऐसे रक्षा उपायों के खिलाफ भी मजबूत रहता है जो इसे कमजोर करने के लिए डिजाइन किए गए अनुकूलित हमलों के विरुद्ध होता है। इस अंतर्दृष्टि का लाभ उठाते हुए, हम SmoothVLM प्रस्तुत करते हैं, एक रक्षा तंत्र जो स्मूथिंग तकनीकों पर आधारित है, विशेष रूप से पैच्ड विज़ुअल प्रॉम्प्ट इंजेक्टरों के खतरे से VLMs की सुरक्षा के लिए तैयार किया गया है। हमारा फ्रेमवर्क दो प्रमुख VLMs पर हमले की सफलता दर को 0% से 5.0% के बीच काफी कम कर देता है, जबकि सौम्य छवियों की लगभग 67.3% से 95.0% तक संदर्भ पुनर्प्राप्ति प्राप्त करता है, जो सुरक्षा और उपयोगिता के बीच संतुलन प्रदर्शित करता है।
सन एट अल. (शुक्रवार,) ने इस प्रश्न का अध्ययन किया।