Key points are not available for this paper at this time.
مؤخراً، تم استخدام نماذج اللغة الكبيرة الموجهة للشفرة (Code LLMs) بشكل واسع وناجح لتبسيط وتسهيل برمجة الشفرة. مع هذه الأدوات، يمكن للمطورين بسهولة إنتاج شفرات وظيفية كاملة حسب الرغبة بناءً على الشفرات غير المكتملة والموجهات من اللغة الطبيعية. ومع ذلك، كشفت بعض الأعمال الرائدة أن هذه النماذج عرضة أيضاً للهجمات، مثل هجمات الباب الخلفي والهجمات المعادية. الأولى يمكن أن تحفز النماذج للاستجابة للمحفزات لإدراج مقتطفات شفرات خبيثة من خلال تسميم بيانات التدريب أو معلمات النموذج، بينما يمكن للأخيرة صياغة شفرات إدخال خبيثة معادية لتقليل جودة الشفرات المولدة. ومع ذلك، فإن كلا طريقتي الهجوم لهما قيود أساسية: الهجمات الخلفية تعتمد على التحكم في عملية تدريب النموذج، بينما الهجمات المعادية تعاني من تحقيق أهداف خبيثة محددة. لوراثة مزايا كل من الهجمات الخلفية والمعادية، تقترح هذه الورقة نموذج هجوم جديد، أي حقن تحفيز محدد الهدف ومعادي (TAPI)، ضد نماذج اللغة الكبيرة للشفرة. تقوم TAPI بإنشاء تعليقات غير قابلة للقراءة تحتوي على معلومات حول التعليمات الخبيثة وتخفيها كمحفزات في الشفرة المصدرية الخارجية. عندما يستفيد المستخدمون من نماذج اللغة الكبيرة للشفرة لإكمال الشفرات التي تحتوي على المحفز، ستقوم النماذج بإنشاء مقتطفات شفرات خبيثة محددة من قبل المهاجم في مواقع معينة. نقيم هجوم TAPI الخاص بنا على أربعة نماذج تمثيلية تحت ثلاثة أهداف خبيثة تمثيلية وسبع حالات. تظهر النتائج أن طريقتنا تمثل تهديداً كبيراً (تحقيق معدل نجاح هجوم يصل إلى 89.3%) وخفية (توفير متوسط 53.1% من الرموز في تصميم المحفز). على وجه الخصوص، هاجمنا بنجاح بعض التطبيقات الشهيرة المدمجة لإكمال الشفرات، بما في ذلك CodeGeex وGithub Copilot. هذا يؤكد مرة أخرى التهديد الواقعي لهجومنا.
درس Yang وآخرون (الجمعة) هذا السؤال.