左スキューと対称分布の観察


10

これを説明するのはかなり難しいですが、問題を理解できるようにしようと思います。したがって、最初に、これまで非常に単純な線形回帰を行ったことを知っておく必要があります。係数を推定する前に、分布を観察しました。左に曲がって重いです。モデルを推定した後、QQ-Plotに左スキューの残差が確かにあるのを確認できましたが、絶対に確認できませんでした。このソリューションの理由は何でしょうか?間違いはどこですか?または、分布はエラー項の分布とは関係ありませんか?yy


@アニコはあなたの前の質問に答え素晴らしい答えを出します。
whuber

回答:


22

あなたの質問に答えるために、非常に簡単な例を見てみましょう。単純回帰モデルは、で与えられます。ここで、です。ここで、が二分であると仮定します。場合ゼロに等しくない場合、その後の分布正常ではなくなります実際には二つの正規分布、平均値を有するものの混合物平均有するもの。yi=β0+β1xi+ϵiϵiN(0,σ2)xiβ1yiβ0β0+β1

場合十分な大きさであると十分に小さいですし、ヒストグラムの、二峰性になります。ただし、「単一」の歪んだ分布のように見えるヒストグラムを取得することもできます。以下に1つの例を示します(Rを使用)。β1σ2yiyi

xi <- rbinom(10000, 1, .2)
yi <- 0 + 3 * xi + rnorm(10000, .7)
hist(yi, breaks=20)
qqnorm(yi); qqline(yi)

重要なのはの分布ではなく、誤差項の分布です。yi

res <- lm(yi ~ xi)
hist(resid(res), breaks=20)
qqnorm(resid(res)); qqline(resid(res))

そしてそれは完全に正常に見えます-比喩的に話すだけでなく=)


「しかし、誤差項の分布」あなたはここで誤差項ではなく残差を意味しますよね?その他のエラー対残差について:stats.stackexchange.com/questions/133389/...
vasili111

7

@Wolfgangからの優れた回答を参照して、ここに彼のRコードからのプロットを示します。

ここに画像の説明を入力してください

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.