非正規分布のエラーが重要性ステートメントの有効性を損なうのはなぜですか


10

OLSモデルを検討する場合、正規性の仮定があり、エラーは正規分布します。私はCross Validatedを閲覧してきましたが、エラーが正常であるために、YとXが通常である必要はないようです。私の質問は、非正規分布エラーがある場合、なぜ重要性ステートメントの有効性が損なわれるのかということです。信頼区間が広すぎたり狭すぎたりするのはなぜですか?

回答:


9

正規分布していないエラーがあるときに、重要性ステートメントの有効性が損なわれるのはなぜですか?信頼区間が広すぎたり狭すぎたりするのはなぜですか?

信頼区間は、分子と分母がt統計で分布する方法に基づいています。

正規データでは、t統計量の分子は正規分布を持ち、分母の二乗(分散)の分布は、カイ2乗分布の特定の倍数です。分子と分母も独立している場合(観測自体が独立している場合、通常のデータの場合にのみ当てはまります)、統計全体にt分布があります。

β^βsβ^βt

データが他の分布からのものである場合、統計にはt分布がありません。たとえば、裾が重い場合、t分布は少し裾が小さくなる傾向があります(外側の観測は分子よりも分母に影響を与えます)。ここに例があります。どちらの場合も、ヒストグラムは10,000回帰の場合です。

ここに画像の説明を入力してください

β=0(2,2)

95%のt間隔(サンプルの勾配の95%を含む必要があります)は、-2.048から2.048までです。通常のデータの場合、実際には10000のサンプル勾配の95.15%が含まれていました。歪んだデータには99.91%が含まれます。


スキューとヘビーテールバージョンにはどのディストリビューションを使用しましたか?
ガン-モニカの回復

2
t
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.