Key points are not available for this paper at this time.
Few-Shot-Bildgenerierung zielt darauf ab, aus einem gegebenen Bereich mehr Daten zu generieren, wobei nur wenige Trainingsbeispiele zur Verfügung stehen. Da es unvernünftig ist, zu erwarten, die Verteilung nur aus wenigen Beobachtungen (z. B. Emojis) vollständig zu inferieren, möchten wir eine große, verwandte Quelldomäne als Vortraining nutzen (z. B. menschliche Gesichter). Damit wollen wir die Vielfalt der Quelldomäne bewahren, während wir uns an das Erscheinungsbild des Ziels anpassen. Wir passen ein vortrainiertes Modell an die wenigen Beispiele der Zielbereich an, ohne zusätzliche Parameter einzuführen. Entscheidend ist, dass wir die Änderungen der Gewichte während dieser Anpassung regulieren, um die Informationen des Quelldatensatzes bestmöglich zu bewaren und gleichzeitig das Ziel anzupassen. Wir demonstrieren die Wirksamkeit unseres Algorithmus, indem wir hochwertige Ergebnisse aus verschiedenen Zielbereichen generieren, einschließlich solcher mit extrem wenigen Beispielen (z. B. <10). Außerdem analysieren wir die Leistung unserer Methode in Bezug auf einige wichtige Faktoren, wie die Anzahl der Beispiele und die Dissimilarität zwischen der Quelle und der Zieldomäne.
Li et al. (Fri,) untersuchten diese Frage.