What type of study is this?

This is a Quantitative Study study.

September 17, 2025Open Access

Integrando Aprendizado por Reforço e LLM com Sistema de Rede de Auto-Otimização

Key Points

A integração do aprendizado por reforço e do modelo de linguagem grande otimiza efetivamente os recursos da rede.
Resultados experimentais demonstram reduções significativas na latência da rede e na perda de pacotes, aprimorando a utilização de recursos.
O framework aproveita dados de sensores em tempo real para ajustar dinamicamente a alocação de largura de banda sob padrões de tráfego variados.
Resultados da simulação sublinham a eficácia da otimização direcionada por sensores em ambientes de rede heterogênea.

Abstract

A rápida expansão das redes de comunicação e as demandas de serviço cada vez mais complexas apresentaram desafios significativos para a gestão inteligente dos recursos da rede. Para enfrentar esses desafios, propomos um framework de auto-otimização de rede que integra as capacidades preditivas do Modelo de Linguagem Grande (LLM) com as capacidades de tomada de decisão do Aprendizado por Reforço (RL) multi-agente. Especificamente, os dados históricos de tráfego de rede são convertidos em entradas estruturadas para prever padrões de tráfego futuros usando um módulo de previsão baseado em GPT-2. Concurrentemente, um algoritmo de Gradiente de Política Determinística Profundo Multi-Agent (MADDPG) aproveita dados de sensores em tempo real—incluindo atraso de link e taxas de perda de pacotes coletadas por sensores de rede incorporados—para otimizar dinamicamente a alocação de largura de banda. Este mecanismo direcionado por sensores permite que o sistema realize otimização em tempo real da alocação de largura de banda, garantindo monitoramento preciso e agendamento proativo de recursos. Avaliamos nosso framework em uma rede heterogênea simulada usando Mininet sob diversos cenários de tráfego. Os resultados experimentais mostram que o método proposto reduz significativamente a latência da rede e a perda de pacotes, além de melhorar a robustez e a utilização de recursos, destacando a eficácia da integração da otimização por RL orientada a sensores com insights preditivos de LLMs.

Read Full Paperexternally

Perguntar à IA

Bookmark

View Full Paper