Key points are not available for this paper at this time.
Hadoop MapReduceは、大規模データ分析を行うための人気の選択肢となっています。この技術報告書では、Hadoop上でのMapReduceジョブの実行を記述するための詳細な数学的パフォーマンスモデルのセットについて説明します。モデルは、ジョブ実行のマップおよびリデュースタスク内のフェーズの細かな粒度でのデータフローとコスト情報を記述しています。これらのモデルは、MapReduceジョブのパフォーマンスを推定するためや、ジョブを実行するときに使用する最適な設定を見つけるために使用できます。
Herodotos Herodotou (Mon,) studied this question.