私は、線形回帰の仮定が少し混乱しています。
これまでのところ、次のことを確認しました。
- すべての説明変数は応答変数と線形に相関していました。(これが事実でした)
- 説明変数間に共線性がありました。(共線性はほとんどありませんでした)。
- 私のモデルのデータポイントのクックの距離は1未満です(これは、すべての距離が0.4未満であるため、影響ポイントがないためです)。
- 残差は正規分布します。(これはそうではないかもしれません)
しかし、私は次を読みました:
(a)従属変数および/または独立変数の分布自体が著しく非正規である、および/または(b)線形性の仮定に違反しているため、正規性の違反がしばしば発生します。
質問1 これにより、独立変数と従属変数を正規分布する必要があるかのように聞こえますが、私が知る限り、そうではありません。私の従属変数は、独立変数の1つと同様に正規分布していません。彼らはすべきですか?
質問2 残差のQQnormalプロットは次のようになります。
これは正規分布とわずかに異なりshapiro.test
、残差が正規分布からのものであるという帰無仮説も棄却します。
> shapiro.test(residuals(lmresult))
W = 0.9171, p-value = 3.618e-06
残差と近似値は次のようになります。
残差が正規分布していない場合はどうすればよいですか?線形モデルはまったく役に立たないということですか?