通常の残差は何を意味し、これは私のデータについて何を教えてくれますか?


13

かなり基本的な質問:

線形回帰の残差の正規分布とはどういう意味ですか?面では、これは回帰からの元のデータにどのように反映されますか?

私は完全に困惑しています、みんなありがとう

回答:


5

実際、線形回帰は、結果の条件付き期待値をモデル化します。ことを意味:あなたは(と言う回帰パラメータの真の値を知っていたならば及びβ 1式の中でそのアウトを充填、あなたの予測Xの値が与えられ、) E [ Y | Xは] = β 0 + β 1 Xは、 あなたが期待値を計算していますYのために、この与えられた値があるすべての(可能性)の観測を超えるXをβ0β1

E[Y|X]=β0+β1X
YX

ただし、与えられたX値の単一の値が(条件付き)平均と正確に等しいと実際に期待することはありません。あなたのモデルが間違っているからではなく、あなたが説明していないいくつかの影響があるからです(例えば、測定誤差)。そのため、特定のX値に対するこれらのY値は、平均値を中心に変動します(つまり、幾何学的に、そのXの回帰直線の点を中心に変動します)YXYXXます。

正規性の仮定では、現在、 sとそれに対応するE [ Y | X ]は、平均がゼロの正規分布に従います。あなたが持っている場合は、この手段、Xの値を、あなたは試すことができますYの最初の計算で値をβ 0 + β 1 X(すなわち、再びE [ Y | X ]、回帰直線上の点)、次のサンプリングε、正常から分布とそれらの追加: Y = E [ Y | ]YE[Y|X]XYβ0+β1XE[Y|X]ϵ

Y=E[Y|X]+ϵ

要するに:この正規分布はあなたの結果の変動を表しているの上に変動モデルで説明。

注:ほとんどのデータセットでは、特定のXに複数の値はありません(予測子セットがカテゴリカルでない限り)が、この正規性はデータセットの観測値だけでなく、母集団全体に適用されます。YX

注:線形回帰の推論は1つの予測子で行いましたが、同じことがさらに続きます。上記の「ライン」を「ハイパープレーン」に置き換えるだけです。


これは素晴らしい説明です!ただし、eが正規分布しているということは、eの最も可能性の高い値が(標準化された後)-1から+1の間にあると仮定するということです。したがって、基本的には、例えばポアソン分布の代わりに正規分布を使用します。正規分布は、これらの値が実際の生活でどのように動作するかをよりよくモデル化するからですか?
user3813234

1

それは多くのことを意味する場合もあれば、何の意味もない場合もあります。モデルを適合させて最高のR二乗を取得した場合、それはあなたが愚かだったことを意味する可能性があります。変数が必要であり、必要であり、外れ値の識別に注意を払うという点でモデルを節約するように適合させた場合、あなたは良い仕事をしました。このhttp://www.autobox.com/cms/index.php?option=com_content&view=article&id=175の詳細については、こちらをご覧ください。


0

残差の正規性は、線形モデルの実行の前提です。したがって、残差が正常である場合、仮定が有効であり、モデルの推論(信頼区間、モデル予測)も有効であることを意味します。とても簡単です!


正規性の仮定は、観測可能な残差に関するものではなく、観測できないエラーに関するものです(したがって、仮定の必要性)。
DLダーリー

2
ええ、しかし、残差を使用して、観測できないエラーに関する仮定をテストします。
wcampbell

 to 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.