Key points are not available for this paper at this time.
이 논문은 작은 장치(예: 모바일 폰 또는 임베디드 기기)에 CNN 모델을 배포하기 위해 딥 뉴럴 네트워크를 가속화하고 압축하는 것을 목표로 합니다. 우리는 필터 수준 가지치기에 집중하며, 즉 필터가 덜 중요하다면 전체 필터가 폐기됩니다. 이 논문에서는 효과적이고 통합된 프레임워크인 ThiNet("Thin Net"의 약자)을 제안합니다. 우리는 필터 가지치기를 최적화 문제로 공식적으로 설정하고, 기존 방법과의 차별화된 점인 현재 층이 아닌 다음 층에서 계산된 통계를 기반으로 필터를 가지치기해야 한다는 사실을 밝혀냅니다. 또한 모델 크기를 줄이기 위해 더 정확한 그룹 컨볼루션 방식인 "gcos" (셔플링이 있는 그룹 컨볼루션)를 제안합니다. 실험 결과는 우리 방법의 효과를 입증하며, 이는 첨단 기술을 향상시켰습니다. 게다가 원래 VGG-16 모델이 2.66 MB 모델 크기만으로도 매우 작은 모델(ThiNet-Tiny)로 압축될 수 있지만, 여전히 AlexNet 수준의 정확도를 유지할 수 있음을 보여줍니다. 이 작은 모델은 다양한 비전 작업(예: 분류, 탐지, 세분화)에 대한 여러 기준에서 평가되며 뛰어난 일반화 능력을 보여줍니다.
Luo 외 (금요일), 이 질문을 연구했습니다.