Große Sprachmodelle (LLMs) werden zunehmend als Agenten in dynamischen, realen Umgebungen eingesetzt, wo Erfolg sowohl Denken als auch effektive Werkzeugnutzung erfordert. Eine zentrale Herausforderung bei agentischen Aufgaben ist die wachsende Kontextlänge, da Agenten lange Geschichten von Aktionen und Beobachtungen ansammeln müssen. Diese Expansion erhöht die Kosten und verringert die Effizienz bei langfristigen Aufgaben, während frühere Arbeiten zur Kontextkompression größtenteils auf Einzel-Schritt-Aufgaben oder eng gefasste Anwendungen fokussiert waren. Wir führen die Agent Context Optimization (ACON) ein, ein einheitliches Framework, das sowohl Umweltbeobachtungen als auch Interaktionsgeschichten optimal in prägnante, aber informative Kondensate komprimiert. ACON nutzt die Optimierung der Kompressionsrichtlinien im natürlichen Sprachraum: Gegebenenfalls gepaarte Trajektorien, bei denen der volle Kontext erfolgreich ist, aber der komprimierte Kontext scheitert, analysieren fähige LLMs die Ursachen des Scheiterns, und die Kompressionsrichtlinie wird entsprechend aktualisiert. Darüber hinaus schlagen wir vor, den optimierten LLM-Kompressor in kleinere Modelle zu destillieren, um den Overhead des zusätzlichen Moduls zu verringern. Experimente auf AppWorld, OfficeBench und Multi-Objective QA zeigen, dass ACON den Speicherverbrauch um 26-54 % (spitzen Token) reduziert und dabei weitgehend die Aufgabenleistung erhält, mehr als 95 % der Genauigkeit bewahrt, wenn in kleinere Kompressoren destilliert, und kleinere LMs als langfristige Agenten mit bis zu 46 % Leistungssteigerung verbessert.
Kang et al. (Mi,) haben diese Frage untersucht.