What type of study is this?

This is a Experimental Study study.

October 5, 2025Open Access

ACON: Optimierung der Kontextkompression für langfristige LLM-Agenten

Key Points

ACON komprimiert Umweltbeobachtungen und Interaktionsgeschichten optimal und steigert die Effizienz bei langfristigen Aufgaben.
Experimente zeigen eine Reduktion des Speicherverbrauchs um 26-54 % bei gleichzeitiger Beibehaltung der Aufgabenleistung über verschiedene Benchmarks.
Die Methodik beinhaltet die Analyse von Misserfolgen bei der Kompression zur Aktualisierung der Richtlinien, was zu verbesserten Ergebnissen für fähige LLMs führt.
Dieser Ansatz erleichtert die Verbesserung kleinerer Sprachmodelle als langfristige Agenten und erreicht bis zu 46 % Leistungssteigerung.

Abstract

Große Sprachmodelle (LLMs) werden zunehmend als Agenten in dynamischen, realen Umgebungen eingesetzt, wo Erfolg sowohl Denken als auch effektive Werkzeugnutzung erfordert. Eine zentrale Herausforderung bei agentischen Aufgaben ist die wachsende Kontextlänge, da Agenten lange Geschichten von Aktionen und Beobachtungen ansammeln müssen. Diese Expansion erhöht die Kosten und verringert die Effizienz bei langfristigen Aufgaben, während frühere Arbeiten zur Kontextkompression größtenteils auf Einzel-Schritt-Aufgaben oder eng gefasste Anwendungen fokussiert waren. Wir führen die Agent Context Optimization (ACON) ein, ein einheitliches Framework, das sowohl Umweltbeobachtungen als auch Interaktionsgeschichten optimal in prägnante, aber informative Kondensate komprimiert. ACON nutzt die Optimierung der Kompressionsrichtlinien im natürlichen Sprachraum: Gegebenenfalls gepaarte Trajektorien, bei denen der volle Kontext erfolgreich ist, aber der komprimierte Kontext scheitert, analysieren fähige LLMs die Ursachen des Scheiterns, und die Kompressionsrichtlinie wird entsprechend aktualisiert. Darüber hinaus schlagen wir vor, den optimierten LLM-Kompressor in kleinere Modelle zu destillieren, um den Overhead des zusätzlichen Moduls zu verringern. Experimente auf AppWorld, OfficeBench und Multi-Objective QA zeigen, dass ACON den Speicherverbrauch um 26-54 % (spitzen Token) reduziert und dabei weitgehend die Aufgabenleistung erhält, mehr als 95 % der Genauigkeit bewahrt, wenn in kleinere Kompressoren destilliert, und kleinere LMs als langfristige Agenten mit bis zu 46 % Leistungssteigerung verbessert.

Read Full Paperexternally

KI fragen

Bookmark

View Full Paper