A rápida expansão das redes de comunicação e as demandas de serviço cada vez mais complexas apresentaram desafios significativos para a gestão inteligente dos recursos da rede. Para enfrentar esses desafios, propomos um framework de auto-otimização de rede que integra as capacidades preditivas do Modelo de Linguagem Grande (LLM) com as capacidades de tomada de decisão do Aprendizado por Reforço (RL) multi-agente. Especificamente, os dados históricos de tráfego de rede são convertidos em entradas estruturadas para prever padrões de tráfego futuros usando um módulo de previsão baseado em GPT-2. Concurrentemente, um algoritmo de Gradiente de Política Determinística Profundo Multi-Agent (MADDPG) aproveita dados de sensores em tempo real—incluindo atraso de link e taxas de perda de pacotes coletadas por sensores de rede incorporados—para otimizar dinamicamente a alocação de largura de banda. Este mecanismo direcionado por sensores permite que o sistema realize otimização em tempo real da alocação de largura de banda, garantindo monitoramento preciso e agendamento proativo de recursos. Avaliamos nosso framework em uma rede heterogênea simulada usando Mininet sob diversos cenários de tráfego. Os resultados experimentais mostram que o método proposto reduz significativamente a latência da rede e a perda de pacotes, além de melhorar a robustez e a utilização de recursos, destacando a eficácia da integração da otimização por RL orientada a sensores com insights preditivos de LLMs.
Xu et al. (Terça,) estudaram esta questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: