Key points are not available for this paper at this time.
MapReduce는 대규모 데이터 세트를 처리하고 생성하기 위한 프로그래밍 모델 및 관련 구현으로, 다양한 실제 작업에 적용할 수 있습니다. 사용자는 맵과 리듀스 함수의 관점에서 계산을 지정하고, 기본 런타임 시스템은 대규모 클러스터의 기계에서 계산을 자동으로 병렬화하며, 기계 오류를 처리하고, 네트워크와 디스크를 효율적으로 사용하기 위해 기계 간 통신을 스케줄합니다. 프로그래머는 시스템을 사용하기 쉽다고 느낍니다: 구글에서는 지난 4년 동안 10,000개 이상의 고유한 MapReduce 프로그램이 내부적으로 구현되었으며, 매일 평균 100,000개의 MapReduce 작업이 구글 클러스터에서 실행되어 하루에 20페타바이트 이상의 데이터가 처리됩니다.
Dean et al. (Tue,)은 이 질문을 연구했습니다.