t分布密度関数の背後にある直感


12

スチューデントのt分布について勉強していますが、t分布密度関数をどのように導出するのか疑問に思い始めました(ウィキペディア、http//en.wikipedia.org/wiki/Student%27s_t-distributionから):

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

ここで、は自由度、Γはガンマ関数です。この機能の直感は何ですか?つまり、二項分布の確率質量関数を見れば、それは理にかなっています。しかし、t分布密度関数は私にはまったく意味がありません...それは一見してまったく直感的ではありません。それとも、それは鐘形の曲線を持ち、それが私たちのニーズを満たすというだけの直観ですか?vΓ

助けのためのThnx :)


3
この分布には、単純な(そしてかなり)幾何学的な解釈があります。実際、Student(1908)は最初にインテリジェントな推測(Monte-Carloシミュレーションでサポート)を介してこの形式のPDFを導き出しましたが、Fisher(c。1920)は最初に幾何学的な引数でそれを取得しました。本質は、ν + 1球上のa(均一に分布した点)の高さとその半径(軸からの距離)の比の分布、つまり緯度の正接の分布を表すということです。この1つのアカウントは、evolvedmicrobe.com / Literature / GeometricTDistribution.pdfで提供されていますfν+1
whuber

回答:


8

あなたは、標準正規確率変数、持っている場合は、および独立したカイ二乗確率変数Qν DFを、その後、ZQν

T=Z/Q/ν

持っていと分布ν DFを。(Z / Qが何として配布されているのかわかりませんが、tではありません。)tνZ/Qt

実際の導出は、かなり標準的な結果です。アレコスはここでいくつかの方法それを行います。

限り直感が行くように、私は特定の関数形式のため、特定の直感を持っていないが、形状の一部の一般的な意味では(によってスケーリングすることを考慮することによって得ることができ)分母上の独立カイ分布は右スキューです:ν

ここに画像の説明を入力してください

モードは、わずかに1未満である(ただし、DFが増加するにつれて1に近い取得)実質的に上記と1の変化以下の値のいくつかの機会で、は、tの分散がZの分散より大きいことを意味します。の値Q/νtZ実質的に1を超えると、tの値はZよりも0に近くなり、1を実質的に下回ると、tの値はZよりも0から遠くなります。Q/νtZtZ

これはすべて、値が(i)可変性が高く、(ii)ピークが比較的大きく、(iii)通常よりも尾が重いことを意味します。dfが増加すると、tは1付近に集中し、tは法線に近くなります。Q/νt

ここに画像の説明を入力してください

(「比較的ピークが高い」とは、スプレッドに対してわずかに鋭いピークになりますが、分散が大きいほど中心が引き下げられます。つまり、dfが低いほどピークはわずかに低くなります)

t


1
私の説明は少しずさんでした。もちろん、カイ二乗分布確率変数の平方根をその自由度で割ったものです。
アナリスト

@Analyst私は同じことを何度もやりました。
Glen_b-モニカの復職

8

グレンの答えは正しいものですが、ベイジアンの観点からは、t分布を異なる分散の正規分布の連続的な混合と考えることも役立ちます。ここから派生を見つけることができます:

ガウス混合のスチューデントt

このアプローチは、人口の正確な変動性がわからないときにt分布がどのように発生するかを明確にするため、直感に役立つと思います。


1
:私はここで、正規分布の混合物としてt分布のアニメーションを作ったsumsar.net/blog/2013/12/t-as-a-mixture-of-normals
ラスマス・バース
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.