Key points are not available for this paper at this time.
لقد أظهرت نماذج التوليد من النص إلى الصورة قدرات مremarkable في توليد صور عالية الجودة بناءً على العبارات النصية. ومع ذلك، فإن صياغة العبارات التي تلتقط بدقة نية المستخدم الإبداعية لا تزال تمثل تحديًا. غالبًا ما يتطلب الأمر إجراءات شاقة من التجريب والخطأ لضمان أن النموذج يفسر العبارات في محاذاة مع نية المستخدم. لمواجهة هذه التحديات، نقدم برومبتيفاي، وهو نظام تفاعلي يدعم استكشاف العبارات وتنقيحها لنماذج التوليد من النص إلى الصورة. يستخدم برومبتيفاي محرّك اقتراح مدفوع بنماذج لغوية كبيرة لمساعدة المستخدمين على استكشاف وصياغة عبارات متنوعة بسرعة. يتيح واجهتنا للمستخدمين تنظيم الصور التي تم إنشاؤها بشكل مرن، وبناءً على تفضيلاتهم، يقترح برومبتيفاي تغييرات محتملة على العبارة الأصلية. هذه الحلقة التغذوية تمكّن المستخدمين من تحسين عباراتهم بشكل تكراري وتعزيز الميزات المرغوبة مع تجنب الميزات غير المرغوبة. تظهر دراستنا للمستخدم أن برومبتيفاي يسهل بشكل فعال سير العمل من النص إلى الصورة، مما يسمح للمستخدمين بإنشاء صور جذابة بصريًا من المحاولة الأولى بينما يتطلب ذلك عبئًا إدراكيًا أقل بشكل كبير من أداة معيارية شائعة الاستخدام.
درس براد وآخرون (الجمعة) هذا السؤال.