Key points are not available for this paper at this time.
수년 동안 네트워크 트래픽 분석 및 생성이 크게 발전해왔습니다. 전통적인 통계적 방법에서 시작하여 이 분야는 정교한 딥 러닝 기술로 발전했습니다. 이러한 발전은 복잡한 패턴 및 보안 위협 탐지 능력을 향상시켰으며, 네트워크 성능을 테스트하고 최적화하는 데 도움을 주었습니다. 그러나 분석을 위한 레이블이 있는 데이터에 대한 의존성 및 현실적인 패턴을 따르는 트래픽 샘플 생성의 어려움과 같은 장애물이 여전히 존재합니다. 사전 훈련된 딥 신경망은 이러한 문제를 해결하기 위한 강력한 도구로 부상하였으며, 대규모 비지도 데이터셋에서 강력한 데이터 표현을 학습함으로써 향상된 성능을 제공합니다. 그럼에도 불구하고 기존의 사전 훈련 모델은 포괄적인 트래픽 분석 및 현실적인 트래픽 생성에서의 유용성을 제한하는 토큰 길이 제한과 같은 어려움에 직면해 있습니다. 이러한 도전에 대응하기 위해, 우리는 긴 흐름 분류 및 생성 작업과 관련된 복잡한 문제를 해결할 수 있는 딥 러닝 모델인 TrafficGPT를 소개합니다. 이 모델은 선형 주의 메커니즘을 갖춘 생성적 사전 훈련을 사용하여 이전의 512개 토큰 제한에서 최대 12,032개 토큰으로 용량을 상당히 증가시킵니다. TrafficGPT는 분류 작업에서 최첨단 수준의 우수한 성능을 보입니다. 생성 작업에서는 실제 트래픽 흐름과 유사하며, 생성된 데이터를 구분하는 데 있어 낮은 JS 발산과 0.5에 가까운 F1 점수를 기록합니다(무작위 추측을 나타냄). 이러한 발전은 트래픽 흐름 분류 및 생성 작업에서의 미래 응용 가능성에 대한 기대감을 높입니다.
Qu et al. (Sat,)가 이 질문을 연구했습니다.