Key points are not available for this paper at this time.
Evolutionsoptimierungsalgorithmen leiten sich oft von groben biologischen Analogien ab und haben Schwierigkeiten, Informationen, die während des sequentiellen Optimierungsprozesses gewonnen wurden, zu nutzen. Ein vielversprechender alternativer Ansatz ist es, Daten zu nutzen und direkt leistungsstarke Optimierungsprinzipien durch Meta-Optimierung zu entdecken. In dieser Arbeit folgen wir einem solchen Paradigma und stellen den Evolution Transformer vor, eine kausale Transformer-Architektur, die flexibel eine Familie von Evolutionsstrategien charakterisieren kann. Gegeben eine Trajektorie von Bewertungen und Statistiken zur Suchverteilung gibt der Evolution Transformer eine leistungsverbessernde Aktualisierung der Suchverteilung aus. Die Architektur setzt eine Reihe geeigneter induktiver Verzerrungen voraus, d.h. die Invarianz der Verteilungsaktualisierung gegenüber der Reihenfolge der Mitglieder einer Population innerhalb einer Generation und die Äquivarianz gegenüber der Reihenfolge der Suchdimensionen. Wir trainieren die Modellsgewichte mit Hilfe der Evolutionsalgorithmus-Destillierung, einer Technik zur überwachten Optimierung von Sequenzmodellen unter Verwendung von Lehreralgorithmus-Trajektorien. Das resultierende Modell zeigt starke in-Kontext-Optimierungsleistungen und zeigt starke Generalisierungsfähigkeiten gegenüber ansonsten herausfordernden Neuroevolution-Aufgaben. Wir analysieren die resultierenden Eigenschaften des Evolution Transformer und schlagen eine Technik vor, um den Evolution Transformer vollständig selbstreferentiell zu trainieren, ausgehend von einer zufälligen Initialisierung und dem Bootstrapping seines eigenen Lernfortschritts. Wir stellen eine Open-Source-Implementierung unter https://github.com/RobertTLange/evosax zur Verfügung.
Lange et al. (Tue,) haben diese Frage untersucht.