June 5, 2024Open Access

Berechnungslimits der Low-Rank-Anpassung (LoRA) für transformerbasierte Modelle

Key Points

Key points are not available for this paper at this time.

Abstract

Wir untersuchen die Berechnungslimits des Low-Rank-Anpassungs (LoRA)-Updates zur Feinabstimmung transformerbasierter Modelle unter Verwendung der feingliedrigen Komplexitätstheorie. Unsere wichtigste Beobachtung ist, dass die Existenz von Low-Rank-Dekompositionen innerhalb der Gradientberechnung der LoRA-Anpassung zu möglichen algorithmischen Beschleunigungen führt. Dies ermöglicht uns (i), ein Phasenübergangsverhalten zu identifizieren, und (ii), die Existenz beinahe linearer Algorithmen zu beweisen, indem wir die LoRA-Updateberechnung stufenweise kontrollieren, vorausgesetzt, die starke exponentielle Zeit-Hypothese (SETH) gilt. Für ersteres identifizieren wir einen deutlichen Übergang in der Effizienz aller möglichen rank-r LoRA-Update-Algorithmen für Transformer, basierend auf spezifischen Normen, die sich aus den Multiplikationen der Eingabesequenz X, vortrainierten Gewichten W^ und Adaptermatrizen B A / r ergeben. Genauer gesagt leiten wir eine gemeinsame obere Schranke für solche Normen ab und zeigen, dass effiziente (unterquadratische) Approximationsalgorithmen von LoRA nur unter dieser Schranke existieren. Für letzteres beweisen wir die Existenz beinahe linearer Approximationsalgorithmen für LoRA-Anpassungen, indem wir die hierarchischen Low-Rank-Strukturen der LoRA-Gradienten nutzen und die Gradienten mit einer Reihe von verketteten Low-Rank-Approximationen annähern. Um unsere Theorie zu veranschaulichen, betrachten wir zwei praktische Szenarien: partielle (z. B. nur WV und WQ) und vollständige Anpassungen (z. B. WQ, WV und WK) der Gewichte in Aufmerksamkeitshorizonten.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jerry Yao-Chieh Hu

Northwestern University

Maojiang Su

En-Jui Kuo

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Berechnungslimits der Low-Rank-Anpassung (LoRA) für transformerbasierte Modelle

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Also consider