Grandes Modelos de Linguagem (LLMs) têm sido amplamente adotados recentemente em agentes conversacionais. No entanto, as interações cada vez mais longas entre usuários e agentes acumulam extensos registros de diálogo, tornando difícil para LLMs com janelas de contexto limitadas manter uma memória de diálogo coerente a longo prazo e fornecer respostas personalizadas. Embora sistemas de memória aumentados por recuperação tenham surgido para enfrentar esse problema, métodos existentes frequentemente dependem de segmentação e recuperação de memória de granularidade única. Essa abordagem falha em captar conexões profundas de memória, levando à recuperação parcial de informações úteis ou ruído substancial, resultando em desempenho subótimo. Para superar essas limitações, propomos o MemGAS, uma estrutura que aprimora a consolidação de memória construindo associação de múltiplas granularidades, seleção adaptativa e recuperação. O MemGAS baseia-se em unidades de memória de múltiplas granularidades e emprega Modelos de Mistura Gaussiana para agrupar e associar novas memórias às históricas. Um roteador baseado em entropia seleciona adaptativamente a granularidade ótima avaliando distribuições de relevância da consulta e equilibrando completude da informação e ruído. Memórias recuperadas são refinadas adicionalmente via filtragem baseada em LLM. Experimentos em quatro benchmarks de memória de longo prazo demonstram que o MemGAS supera métodos de última geração em tarefas de perguntas e respostas e recuperação, alcançando desempenho superior através de diferentes tipos de consulta e configurações top-K.
Xu et al. (Mon,) estudaram esta questão.