回答:
実際、線形回帰は、結果の条件付き期待値をモデル化します。ことを意味:あなたは(と言う回帰パラメータの真の値を知っていたならば及びβ 1式の中でそのアウトを充填、あなたの予測Xの値が与えられ、) E [ Y | Xは] = β 0 + β 1 Xは、 あなたが期待値を計算していますYのために、この与えられた値があるすべての(可能性)の観測を超えるXを。
ただし、与えられたX値の単一の値が(条件付き)平均と正確に等しいと実際に期待することはありません。あなたのモデルが間違っているからではなく、あなたが説明していないいくつかの影響があるからです(例えば、測定誤差)。そのため、特定のX値に対するこれらのY値は、平均値を中心に変動します(つまり、幾何学的に、そのXの回帰直線の点を中心に変動します)ます。
正規性の仮定では、現在、 sとそれに対応するE [ Y | X ]は、平均がゼロの正規分布に従います。あなたが持っている場合は、この手段、Xの値を、あなたは試すことができますYの最初の計算で値をβ 0 + β 1 X(すなわち、再びE [ Y | X ]、回帰直線上の点)、次のサンプリングε、正常から分布とそれらの追加: Y ′ = E [ Y | ]
要するに:この正規分布はあなたの結果の変動を表しているの上に変動モデルで説明。
注:ほとんどのデータセットでは、特定のXに複数の値はありません(予測子セットがカテゴリカルでない限り)が、この正規性はデータセットの観測値だけでなく、母集団全体に適用されます。
注:線形回帰の推論は1つの予測子で行いましたが、同じことがさらに続きます。上記の「ライン」を「ハイパープレーン」に置き換えるだけです。
それは多くのことを意味する場合もあれば、何の意味もない場合もあります。モデルを適合させて最高のR二乗を取得した場合、それはあなたが愚かだったことを意味する可能性があります。変数が必要であり、必要であり、外れ値の識別に注意を払うという点でモデルを節約するように適合させた場合、あなたは良い仕事をしました。このhttp://www.autobox.com/cms/index.php?option=com_content&view=article&id=175の詳細については、こちらをご覧ください。