非正規分布のエラーが重要性ステートメントの有効性を損なうのはなぜですか

OLSモデルを検討する場合、正規性の仮定があり、エラーは正規分布します。私はCross Validatedを閲覧してきましたが、エラーが正常であるために、YとXが通常である必要はないようです。私の質問は、非正規分布エラーがある場合、なぜ重要性ステートメントの有効性が損なわれるのかということです。信頼区間が広すぎたり狭すぎたりするのはなぜですか？

— ユーザー44278
ソース

正規分布していないエラーがあるときに、重要性ステートメントの有効性が損なわれるのはなぜですか？信頼区間が広すぎたり狭すぎたりするのはなぜですか？

信頼区間は、分子と分母がt統計で分布する方法に基づいています。

正規データでは、t統計量の分子は正規分布を持ち、分母の二乗（分散）の分布は、カイ2乗分布の特定の倍数です。分子と分母も独立している場合（観測自体が独立している場合、通常のデータの場合にのみ当てはまります）、統計全体にt分布があります。

$\frac{\hat \beta - \beta}{s_{\hat\beta}}$ $\beta$ $t$

データが他の分布からのものである場合、統計にはt分布がありません。たとえば、裾が重い場合、t分布は少し裾が小さくなる傾向があります（外側の観測は分子よりも分母に影響を与えます）。ここに例があります。どちらの場合も、ヒストグラムは10,000回帰の場合です。

ここに画像の説明を入力してください

$\beta=0$ $(-2,2)$

95％のt間隔（サンプルの勾配の95％を含む必要があります）は、-2.048から2.048までです。通常のデータの場合、実際には10000のサンプル勾配の95.15％が含まれていました。歪んだデータには99.91％が含まれます。

— Glen_b-モニカの復活
ソース

スキューとヘビーテールバージョンにはどのディストリビューションを使用しましたか？

— ガン-モニカの回復

t

$t$