Key points are not available for this paper at this time.
لقد أحدثت نماذج اللغة الكبيرة (LLMs)، مثل ChatGPT وBard، ثورة في فهم وتوليد اللغة الطبيعية. فهي تمتلك فهماً عميقاً للغة، قدرات توليد نصوص شبيهة بالبشر، وعيًا سياقيًا، ومهارات قوية في حل المشكلات، مما يجعلها لا تقدر بثمن في مجالات متنوعة (مثل محركات البحث، دعم العملاء، الترجمة). وفي الوقت نفسه، اكتسبت نماذج اللغة الكبيرة أيضًا اهتمامًا في مجتمع الأمن السيبراني، كاشفة عن ثغرات أمنية وعارضة إمكاناتها في المهام المتعلقة بالأمن. تستكشف هذه الورقة تقاطع نماذج اللغة الكبيرة مع الأمان والخصوصية. على وجه الخصوص، نحقق كيف تؤثر نماذج اللغة الكبيرة إيجابيًا على الأمان والخصوصية، والمخاطر والتهديدات المحتملة المرتبطة باستخدامها، والثغرات الكامنة داخلها. من خلال مراجعة أدبية شاملة، تصنف الورقة الأوراق البحثية إلى "الجيد" (تطبيقات مفيدة لنماذج اللغة الكبيرة)، "السيء" (التطبيقات الهجومية)، و"القبيح" (ثغرات نماذج اللغة الكبيرة ودفاعاتها). لدينا نتائج مثيرة للاهتمام. على سبيل المثال، ثبت أن نماذج اللغة الكبيرة تعزز أمان الكود (كشف ثغرات الكود) وخصوصية البيانات (حماية سرية البيانات)، متفوقةً على الطرق التقليدية. ومع ذلك، يمكن استغلالها أيضًا في هجمات متنوعة (وخاصة هجمات على مستوى المستخدم) بسبب قدراتها على التفكير الشبيه بالبشر. حددنا مجالات تحتاج إلى مزيد من الجهود البحثية. على سبيل المثال، البحث في هجمات استخراج النماذج والمعلمات محدود وغالبًا نظري، ويتعثر بسبب حجم معلمات نماذج اللغة الكبيرة وسريتها. كذلك، تتطلب الضبط الآمن للتعليمات، وهو تطور حديث، مزيدًا من الاستكشاف. نأمل أن يسلط عملنا الضوء على قدرة نماذج اللغة الكبيرة على تعزيز الأمن السيبراني وكذلك تعريضه للخطر.
درس ياو وآخرون (Fri,) هذا السؤال.