Key points are not available for this paper at this time.
신흥 응용 프로그램은 여러 작업을 동시에 해결하기 위해 수많은 깊은 신경망(DNN)을 활용합니다. 이러한 응용 프로그램이 계속 확장됨에 따라, 다양한 DNN 모델의 계산, 메모리 및 통신 요구에 적응할 수 있는 오프 칩 메모리 접근 최적화 및 혁신적인 아키텍처에 대한 필요성이 커지고 있습니다. 이러한 과제를 해결하기 위해 우리는 여러 DNN의 동시 실행을 위한 효율적인 계산, 메모리 및 통신 지원을 제공할 수 있는 다목적 DNN 가속기인 Versa-DNN을 제안합니다. Versa-DNN은 유연한 오프 칩 메모리 접근 최적화 전략, 적응 가능한 통신 패브릭 및 통신 및 계산 인지 스케줄링 알고리즘의 세 가지 고유한 설계를 특징으로 합니다. 제안된 오프 칩 메모리 최적화 전략은 하드웨어 활용률을 증가시키고, 과도한 데이터 중복을 제거하며, 오프 칩 메모리 접근을 줄임으로써 성능과 에너지 효율성을 향상시킬 수 있습니다. 적응 가능한 통신 패브릭은 분산 버퍼, 처리 요소 및 유연한 칩 내 네트워크(NoC)로 구성되어 있으며, 이는 동시에 실행되는 DNN 모델의 고유한 통신 및 계산 요구를 지원하기 위해 동적으로 변형되고 분열될 수 있습니다. 또한, 제안된 스케줄링 정책은 여러 DNN 모델의 동시 실행을 관리하여 성능과 에너지 효율성을 개선합니다. 여러 DNN 모델을 사용한 시뮬레이션 결과, 제안된 Versa-DNN 아키텍처는 Planaria, Herald 및 AI-MT와 같은 최첨단 가속기와 비교할 때 각각 평균 41%, 238%, 392% 처리량 속도 향상 및 30%, 59%, 63% 에너지 절약을 달성합니다.
Yang et al. (금요일) 이 질문을 연구했습니다.