Key points are not available for this paper at this time.
우리는 수백만 개의 행과 열, 수십억 개의 비제로 요소를 가진 큰 행렬을 대략적으로 분해하기 위한 새로운 알고리즘을 제공합니다. 우리의 접근법은 반복적인 확률적 최적화 알고리즘인 확률적 경량 하강법(SGD)에 기반합니다. 우리는 먼저 손실 함수가 '층 손실'의 가중합으로 표현될 수 있는 일반 손실 최소화 문제에 적용되는 새로운 '계층화' SGD 변형(SSGD)을 개발합니다. 우리는 확률적 근사 이론과 재생 과정 이론의 결과를 사용하여 SSGD의 수렴을 위한 충분 조건을 설정합니다. 그런 다음 SSGD를 특화하여 DSGD라는 새로운 행렬 분해 알고리즘을 얻는데, 이는 완전히 분산될 수 있으며 예를 들어, MapReduce를 사용하여 웹 규모의 데이터셋에서 실행할 수 있습니다. DSGD는 다양한 행렬 분해를 처리할 수 있습니다. 우리는 우리의 DSGD 구현에서 성능을 최적화하는 데 사용되는 실제 기술을 설명합니다. 실험 결과에 따르면 DSGD는 다른 알고리즘보다 상당히 더 빠르게 수렴하고 더 나은 확장성 특성을 가지고 있습니다.
Gemulla et al. (Sun,)은 이 문제를 연구했습니다.