線形回帰の仮定


7

簡単に言えば、線形回帰の仮定は何ですか?

線形回帰モデルをデータセットに適用できることを知りたいだけです。


回答が十分であれば、回答を承認済みとしてマークすることができます。それはしばらくの間ここにあり、あなたはまだそれをマークしていません。
TwinPenguins 2018

回答:


14

3つの主要な仮定(統計的に厳密に言えば)があります。

  1. 従属変数とリグレッサの間には線形関係があります(下の右図)。つまり、作成しているモデルが実際にデータに適合しています。 ここに画像の説明を入力してください

  2. データのエラーまたは残差は通常、分散され、互いに独立しています。 ここに画像の説明を入力してください

  3. ホモセダスティシティ。これは、予測変数のすべての値について、回帰直線の周りの分散が同じであることを意味します。 ここに画像の説明を入力してください

更新2::多重共線性は仮定ではありませんが、特にモデルの解釈可能性が重要である場合、それはむしろ健全性チェックです(コメントについてRicardo Cruzに感謝します)。多重共線性は、独立変数が互いに独立していない場合に発生します。説明変数間の多重共線性により、パラメーターの適合が不安定になる可能性があります(KT。に指摘していただきありがとうございます)。これを検証するために使用できる相関行列(ピアソンの2変量相関)、分散インフレ係数などのテストがあります。


1
厳密に言えば、3はモデルの直接の仮定ではありません。ただし、入力の共線性によりパラメーターの適合が不安定になるため、煩わしい場合があります。
KT。

これ以上同意できませんでした!
TwinPenguins

次に、「2。と4。これには、線形モデルの確率的公式に正確に対応する2つの仮定があります。
KT。

1
「これは不安定なパラメーターフィットにつながる可能性があります」-初心者の場合、これはパラメーターを解釈する場合にのみ問題になることを追加する必要があります。パラメータが安定していないからといって、モデル自体が安定しておらず、予測が不正確であるという意味ではありません。多くの人は、解釈可能性ではなく、予測可能性のみを懸念しています。その場合、多重共線形性は問題ではありません。
Ricardo Cruz

Homoscedasticity例を使ってもう少し説明できますか?それははっきりしていません。あなたは私の質問の1つに重複としてマークを付けました。説明できる?
サイクマー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.