以下のウィキペディアの定義を見てください:
それは私に見える
ここで、はサンプル数、は推定値です。
ただし、ウィキペディアの記事のいずれもこの関係について言及していません。どうして?何か不足していますか?
以下のウィキペディアの定義を見てください:
それは私に見える
ここで、はサンプル数、は推定値です。
ただし、ウィキペディアの記事のいずれもこの関係について言及していません。どうして?何か不足していますか?
回答:
ただし、Sum of Squared Erros(SSE)とResidue Sum of Squares(RSS)が時々交換可能に使用されるため、読者を混乱させることに注意してください。たとえば、線形回帰の詳細については、このURL(https://365datascience.com/sum-squares/)を確認してください。
統計的な観点から厳密に言えば、エラーと残留はまったく異なる概念です。エラーは主に、実際に観測されたサンプル値と予測値の違いを指し、主にルート平均二乗誤差(RMSE)や平均絶対誤差(MAE)などの統計メトリックで使用されます。対照的に、残差は、従属変数と線形回帰からの推定値との差のみを指します。
MSEがRMSEの尺度であると考える場合、ここでこれが正しいとは思わない。たとえば、予測と観測に関する一連のサンプリングデータがあり、線形回帰を実行しようとしています:観測(O)= a + b X予測(P)。この場合、MSEはOとPの差の二乗和をサンプルサイズNで割ったものです。
ただし、線形回帰の実行方法を測定する場合は、平均二乗残差(MSR)を計算する必要があります。同じ場合、最初に実際の観測値と線形回帰から導出された予測観測値との差の二乗和に対応する残差二乗和(RSS)を計算します。次に、RSSをN-2で割って、 MSRを取得します。
簡単に言えば、この例では、RSSコンポーネントはMSEの計算に使用されるコンポーネントと同じではないため、RSS / Nを使用してMSEを推定することはできません。