ウィキペディアによると、サンプルが正規分布母集団からのiid観測である場合、t分布はt値のサンプリング分布であることを理解しています。ただし、t分布の形状がファットテールからほぼ完全に正常に変化する理由を直感的に理解できません。
正規分布からサンプリングしている場合、大きなサンプルを取得した場合、その分布に似ていますが、なぜそれが太い尾の形で始まるのかわかりません。
ウィキペディアによると、サンプルが正規分布母集団からのiid観測である場合、t分布はt値のサンプリング分布であることを理解しています。ただし、t分布の形状がファットテールからほぼ完全に正常に変化する理由を直感的に理解できません。
正規分布からサンプリングしている場合、大きなサンプルを取得した場合、その分布に似ていますが、なぜそれが太い尾の形で始まるのかわかりません。
回答:
直感的な説明をしようと思います。
t統計*には分子と分母があります。たとえば、1つのサンプルt検定の統計は次のとおりです。
*(いくつかありますが、この議論はあなたが尋ねているものをカバーするのに十分なほど一般的であるべきです)
仮定の下では、分子の平均分布は0であり、いくつかの未知の標準偏差を持つ正規分布になります。
同じ仮定のセットでは、分母は分子の分布の標準偏差の推定値です(分子の統計の標準誤差)。分子とは無関係です。その平方は、自由度(t分布のdfでもある)回で除したカイ二乗確率変数です。。
自由度が小さい場合、分母はかなり右に傾く傾向があります。平均よりも小さい可能性が高く、かなり小さい可能性が比較的高いです。同時に、平均よりもはるかに大きくなる可能性もあります。
正規性の仮定の下では、分子と分母は独立しています。したがって、このt統計の分布からランダムに描画する場合、平均1前後の右スキュー分布から2番目にランダムに選択した値で割った正規乱数を取得します。
*通常の用語に関係なく
分母上にあるため、分母の分布の小さな値は非常に大きなt値を生成します。分母の右スキューは、t統計量をヘビーテールにします。分母に同じ標準偏差より鋭く尖っ通常よりt分布させる分布の右尾、Tは。
ただし、自由度が大きくなると、分布ははるかに正規に見え、その平均をはるかに上回る「タイト」になります。
そのため、分子の分布の形状に対する分母による除算の効果は、自由度が増加するにつれて減少します。
最終的に-Slutskyの定理が示唆するように、分母の効果は定数で除算するようになり、t統計量の分布は非常に正規に近くなります。
whuberは、分母の逆数を見る方がより照明になるかもしれないとコメントで示唆しました。つまり、分子(通常)と分母の逆数(右スキュー)の積としてt統計を書くことができます。
たとえば、上記のone-sample-t統計は次のようになります。
次に、元の母標準偏差を考えます 、 σ xと。次のように、乗算と除算ができます。
最初の項は標準の標準です。次に、2番目の項(スケーリングされた逆カイ2乗確率変数の平方根)は、その標準法線を1よりも大きいまたは小さい値でスケーリングします。
正規性の仮定の下では、製品の2つの用語は独立しています。したがって、このt統計の分布からランダムに抽出すると、正規分布の乱数(製品の最初の項)に2番目のランダムに選択された値(正規項に関係なく)があります。通常は約1です。
dfが大きい場合、値は1に非常に近くなる傾向がありますが、dfが小さい場合、かなりゆがみ、スプレッドが大きくなります。このスケーリング係数の大きな右テールによりテールが非常に太くなります。
初心者としての直感を助けてくれるものを共有したかっただけです(ただし、他の答えよりも厳密ではありません)。