Key points are not available for this paper at this time.
डिफ्यूज़न-आधारित इमेज संपादन स्रोत इमेज सामग्री को बनाए रखने और नई सामग्री उत्पन्न करने या संशोधन लागू करने की एक मिश्रित प्रक्रिया है। जबकि वर्तमान संपादन दृष्टिकोणों ने टेक्स्ट मार्गदर्शन के तहत सुधार किया है, इनमें से अधिकांश केवल इनपुट इमेज की जानकारी को संरक्षित करने पर ध्यान केंद्रित करते हैं, संपादनीयता और लक्षित संकेत के प्रति संरेखण के महत्व की अनदेखी करते हैं। इस पेपर में, हम संपादनीयता को प्राथमिकता देते हैं और एक जीरो-शॉट इमेज संपादन विधि का प्रस्ताव करते हैं, जिसे Enhance Editability for text-based image Editing via Efficient CLIP guidance (E4C) कहा जाता है, जो स्पष्ट रूप से खाद्य सामग्री और टेक्स्ट संरेखण को बढ़ाने के लिए केवल अनुमान-चरण अनुकूलन की आवश्यकता होती है। विशेष रूप से, हम एकीकृत दो-शाखा फ़ीचर-शेयरिंग पाइपलाइन विकसित करते हैं जो स्रोत इमेज की संरचना या बनावट को संरक्षित करने की अनुमति देती है जबकि दूसरे को संपादन कार्य के आधार पर अनुकूलित किया जा सकता है। हम अपने पाइपलाइन में CLIP मार्गदर्शन को एकीकृत करते हैं जो हमारे नवीन रैंडम-गेटवे अनुकूलन तंत्र का उपयोग करके लक्षित संकेत के साथ अर्थ संबंध को प्रभावी ढंग से बढ़ाता है। व्यापक मात्रात्मक और गुणात्मक प्रयोग यह दर्शाते हैं कि हमारी विधि मौजूदा विधियों में प्रचलित टेक्स्ट संरेखण समस्याओं को प्रभावी ढंग से हल करती है जबकि स्रोत इमेज की सत्यनिष्ठता को बनाए रखती है, और संपादन कार्यों की एक विस्तृत श्रृंखला में अच्छा प्रदर्शन करती है।
हुआंग एट अल। (शुक्र,) ने इस प्रश्न का अध्ययन किया।