What type of study is this?

This is a Experimental Study study.

September 29, 2025Open Access

Rumo à Associação e Seleção de Memória Multi-Granular para Agentes Conversacionais de Longo Prazo

Key Points

O MemGAS melhora a recuperação de memória em agentes conversacionais, alcançando desempenho superior em benchmarks de memória de longo prazo.
Métodos de última geração apresentaram limitações significativas ao lidar com históricos longos de diálogo, enquanto o MemGAS resolve esses problemas com sucesso.
A estrutura utiliza Modelos de Mistura Gaussiana para agrupar memórias, promovendo melhor recuperação de informação relevante e redução de ruído.
Experimentos implementados confirmaram que o MemGAS adapta efetivamente a seleção de memória, melhorando tanto tarefas de perguntas e respostas quanto de recuperação.

Abstract

Grandes Modelos de Linguagem (LLMs) têm sido amplamente adotados recentemente em agentes conversacionais. No entanto, as interações cada vez mais longas entre usuários e agentes acumulam extensos registros de diálogo, tornando difícil para LLMs com janelas de contexto limitadas manter uma memória de diálogo coerente a longo prazo e fornecer respostas personalizadas. Embora sistemas de memória aumentados por recuperação tenham surgido para enfrentar esse problema, métodos existentes frequentemente dependem de segmentação e recuperação de memória de granularidade única. Essa abordagem falha em captar conexões profundas de memória, levando à recuperação parcial de informações úteis ou ruído substancial, resultando em desempenho subótimo. Para superar essas limitações, propomos o MemGAS, uma estrutura que aprimora a consolidação de memória construindo associação de múltiplas granularidades, seleção adaptativa e recuperação. O MemGAS baseia-se em unidades de memória de múltiplas granularidades e emprega Modelos de Mistura Gaussiana para agrupar e associar novas memórias às históricas. Um roteador baseado em entropia seleciona adaptativamente a granularidade ótima avaliando distribuições de relevância da consulta e equilibrando completude da informação e ruído. Memórias recuperadas são refinadas adicionalmente via filtragem baseada em LLM. Experimentos em quatro benchmarks de memória de longo prazo demonstram que o MemGAS supera métodos de última geração em tarefas de perguntas e respostas e recuperação, alcançando desempenho superior através de diferentes tipos de consulta e configurações top-K.

Read Full Paperexternally

Perguntar à IA

Bookmark

View Full Paper