誤差と残差の違いは何ですか?


20

これらの2つの一般的な用語はしばしば同義語として使用されますが、区別がある場合もあります。実際に違いはありますか、それとも同義語ですか?


時間がある場合の包括的な処置については、Qin&Gilbertの「時系列計量経済学の歴史におけるエラー用語」ご覧ください。ああ、しかしこれは時系列データ専用です。
リチャードハーディ

回答:


20

エラーは真のデータ生成プロセス(DGP)に関係しますが、残差はモデルを推定した後に残ったものです。実際、正規性、等分散性、独立性などの仮定は、モデルの残差ではなくDGPの誤差に適用されます。(例えば、フィットただけ、あなたのモデルのパラメータを N - P + 1 。残差は独立することができます)しかし、我々は唯一の残差へのアクセス権を持っているので、その我々が働く何の。 p+1N(p+1)


9
(+1)残差は誤差の推定値と見なすことができます。
Scortchi-モニカの復職

@ABC DGPは、データ生成プロセスの略です。モデルが適切であり、DGPの真の構造を反映している場合でも、基礎となるエラーがそうでなければ、残差は必ずしも正常で、ホモセダスティックで独立ではありません。
GUNG -復活モニカ

@Scortchiこんにちは、あなたのコメントを拡張する参照がありますか?私は実際の仮定がエラーの正規性であるときに回帰分析で残差の正規性をチェックしている人々を見ているので、正確に残差をエラーの推定値として使用できる理由を理解しようとしていますが、なぜそれが有効なのか正確にはわかりません。
オースティン

@オースティン、まだそれに興味があるなら、新しい質問をするべきです。
gung-モニカの復職

13

誤差は、観測値と(DGPによって生成された非常にしばしば観測されない)、真値との差です。

残差は観測値と(モデルにより)予測値との差です。


±

このリンク(ece.rochester.edu/courses/ECE111/error_uncertainty.pdf)は、このテーマに関するBevingtonとTaylorのテキストへの参照を含む適切な説明を提供します。
スティーブンC.ハウエル

機械学習言語では、残余はトレーニングエラーであり、エラーはテストエラーですか?
チャールズチャウ

@CharlesChow使用するデータセットによって異なります。トレーニングセットを使用する場合、トレーニングエラーです。テストセットを使用する場合、テストエラーです。
レオポルドW.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.