May 17, 2024Open Access

पैच्ड विज़ुअल प्रॉम्प्ट इंजेक्टरों के खिलाफ विज़न-लैंग्वेज मॉडल्स की सुरक्षा

Key Points

Key points are not available for this paper at this time.

Abstract

लार्ज लैंग्वेज मॉडल्स दिन-ब-दिन अधिक प्रमुख होते जा रहे हैं, जो यह संकेत भी देते हैं कि आर्टिफिशियल इंटेलिजेंस के अगले क्षेत्र के रूप में मल्टीमॉडलिटी की ओर बढ़ोतरी हो रही है, जहाँ उनके एम्बेडिंग्स को प्रॉम्प्ट के रूप में उपयोग करके टेक्स्टुअल कंटेंट उत्पन्न किया जाता है। विज़न-लैंग्वेज मॉडल्स (VLMs) इस प्रगति के अग्रिम पंक्ति में हैं, जो दृश्य और पाठ्य डेटा को जोड़ने के नवोन्मेषी तरीके प्रदान करते हैं ताकि बेहतर समझ और इंटरैक्शन हो सके। हालांकि, इस एकीकरण से हमले की सतह भी बढ़ जाती है। पैच-आधारित विरोधी हमला भौतिक विज़न अनुप्रयोगों में सबसे यथार्थवादी खतरे के मॉडल के रूप में माना जाता है, जैसा कि कई मौजूदा साहित्य में दिखाया गया है। इस पेपर में, हम पैच्ड विज़ुअल प्रॉम्प्ट इंजेक्शन को संबोधित करने का प्रस्ताव देते हैं, जहाँ विरोधी पैचों का उपयोग करके VLMs में लक्षित सामग्री उत्पन्न की जाती है। हमारे अध्ययन से पता चलता है कि पैच्ड विरोधी प्रॉम्प्ट पिक्सेल-वार यादृच्छिकता के प्रति संवेदनशील होते हैं, एक ऐसा गुण जो ऐसे रक्षा उपायों के खिलाफ भी मजबूत रहता है जो इसे कमजोर करने के लिए डिजाइन किए गए अनुकूलित हमलों के विरुद्ध होता है। इस अंतर्दृष्टि का लाभ उठाते हुए, हम SmoothVLM प्रस्तुत करते हैं, एक रक्षा तंत्र जो स्मूथिंग तकनीकों पर आधारित है, विशेष रूप से पैच्ड विज़ुअल प्रॉम्प्ट इंजेक्टरों के खतरे से VLMs की सुरक्षा के लिए तैयार किया गया है। हमारा फ्रेमवर्क दो प्रमुख VLMs पर हमले की सफलता दर को 0% से 5.0% के बीच काफी कम कर देता है, जबकि सौम्य छवियों की लगभग 67.3% से 95.0% तक संदर्भ पुनर्प्राप्ति प्राप्त करता है, जो सुरक्षा और उपयोगिता के बीच संतुलन प्रदर्शित करता है।

पैच्ड विज़ुअल प्रॉम्प्ट इंजेक्टरों के खिलाफ विज़न-लैंग्वेज मॉडल्स की सुरक्षा

Key Points

Abstract

Cite This Study