Key points are not available for this paper at this time.
回帰分析は、教師あり機械学習の大部分を占め、他の予測変数の集合から連続的な独立ターゲットの予測を行います。バイナリ分類と回帰の違いはターゲット範囲にあります:バイナリ分類ではターゲットは通常0と1として符号化される2つの値しか持てませんが、回帰ではターゲットは複数の値を持つことができます。回帰分析は多くの機械学習研究で使用されていますが、回帰自体の結果を評価するための単一かつ統一された標準的なメトリックには合意が得られていません。多くの研究が平均二乗誤差(MSE)やその平方根の変種(RMSE)、または平均絶対誤差(MAE)やその百分率の変種(MAPE)を使用しています。これらの指標は有用であるものの、共通の欠点があります。値がゼロから+∞まで範囲を持つため、単一の値は真実の要素の分布に対する回帰のパフォーマンスについてあまり多くを語らないのです。本研究では、実際に真実のグループの要素の大部分が正しく予測された場合にのみ高得点を生成する2つの比率、すなわち決定係数(R二乗またはR²とも呼ばれる)と対称平均絶対パーセンテージ誤差(SMAPE)に焦点を当てます。これらの数学的特性を示した後、R²とSMAPEのいくつかのユースケースおよび2つの実際の医療シナリオでの比較を報告します。私たちの結果は、決定係数(R二乗)がSMAPEよりも情報量が多く、MSE、RMSE、MAE、MAPEの解釈制限を持たないことを示しています。したがって、私たちは任意の科学分野で回帰分析を評価するための標準的なメトリックとしてR二乗の使用を提案します。
Chicco et al. (Mon,) はこの問題を研究しました。