Key points are not available for this paper at this time.
깊은 네트워크 훈련은 시간이 많이 소요되는 과정으로, 객체 인식을 위한 네트워크는 종종 훈련하는 데 여러 일이 걸립니다. 이러한 이유로, 훈련을 가속화하기 위해 클러스터 자원을 활용하는 것은 중요한 작업 영역입니다. 그러나 MapReduce 및 Spark와 같은 인기 있는 배치 처리 계산 프레임워크는 기존의 분산 딥 러닝 시스템의 비동기적이고 통신 집약적인 작업을 지원하도록 설계되지 않았습니다. 우리는 Spark에서 깊은 네트워크를 훈련하기 위한 프레임워크인 SparkNet을 소개합니다. 우리의 구현은 Spark RDD에서 데이터를 읽기 위한 편리한 인터페이스, Caffe 딥 러닝 프레임워크에 대한 Scala 인터페이스 및 경량 다차원 텐서 라이브러리를 포함합니다. 확률적 경량 최적화에 대한 간단한 병렬화 방식을 사용하여, SparkNet은 클러스터 크기에 잘 확장되고 매우 높은 지연 통신을 견딜 수 있습니다. 또한 매개변수 튜닝 없이 배포 및 사용이 용이하며, 기존 Caffe 모델과 호환됩니다. 우리는 SparkNet에 의해 얻어진 속도 향상이 기계 수, 통신 빈도 및 클러스터의 통신 오버헤드에 대한 의존도를 정량화하고, ImageNet 데이터 세트에서 시스템의 성능을 벤치마킹합니다.
모리츠 외(Thu,)는 이 질문을 연구했습니다.