t変量の二乗和とは何ですか?


20

みましょうでスチューデントのt分布からIID描かれる適度なサイズのため、自由度(100未満を言います)。定義 である有するほぼカイ二乗として配布自由度?ランダム変数の平方和の中心極限定理のようなものはありますか?、N 、N T = Σ 1 I K T 2 I T Ktinn

T=1ikti2
Tk

@suncoolsu:「ほぼ」と言う
...-shabbychef

謝罪いたします。それを見なかった。
suncoolsu

回答:


14

最初の質問に答えます。

私たちは、mpiktasによって指摘事実、それから始めることができる。そして、F 1 n によって分布する2つのランダム変数の合計の分布の最初の検索で、より簡単な手順を試してください。これは、2つのランダム変数のコンボリューションを計算するか、それらの特性関数の積を計算することで実行できます。t2F1nF1n

PCB Phillips の記事は、「[コンフルエント]超幾何関数が関係している」という私の最初の推測が確かに真実だったことを示しています。つまり、解決策は簡単ではなく、ブルートフォースは複雑ですが、質問に答えるために必要な条件です。したがって、は固定されており、t分布を合計するため、最終結果がどうなるかを確実に言うことはできません。誰かがコンフルエントな超幾何関数の製品で遊ぶ良いスキルを持っていない限り。n


2
リンクの+1は、F分布の特性関数が非常に複雑であることを知りませんでした。
mpiktas

14

それは厳密な近似でさえありません。 小さい場合Tの期待値はk nに等しくなりますnTの期待に対し、χ2kは等しいKを。場合kが小さい(例えば、10未満の)のヒストグラムログTとのログχ2Kもシフト及び再スケーリングことを示す、同じ形状を有していないTがまだ動作しません。knn2χ2(k)kklog(T)log(χ2(k))T

直感的に、小さな自由度の場合、スチューデントのはヘビーテールです。それを二乗すると、その重さが強調されます。合計は、したがって、より斜めであろう-通常はるかにもっと傾い-二乗法線(の和よりχ 2分布)。計算とシミュレーションがこれを裏付けています。tχ2


イラスト(リクエストに応じて)

代替テキスト

各ヒストグラムは、指定された自由度()と加数(k)を使用して、@ mpiktasで説明されているように標準化された100,000回の試行の独立したシミュレーションを表します。値は、N = 9999下段には、近似χ 2ケース。したがって、あなたは比較することができますTをχ 2各列を下にスキャンすることによって。nkn=9999χ2Tχ2

適切な瞬間が存在しないため、標準化は不可能であることに注意してください。形状の安定性の欠如(あなたが任意の行を横切って、または任意の列ダウン上から下へ、左から右にスキャンされるように)より一層のためにマークされているN 4n<5n4


私はそれが怖かったのですが、合計することでやや尾を引くと思いました。
みすぼらしいシェフ

また、私は何を参照しようとし、モンテカルロ実験のいくつかの並べ替えを生成すると考えられおよびkのために十分に近いかもしれない近似をχ 2kはおそらく、kはN 私たちはここに必要があること。しかし、小さいkおよび特にnの場合、実際には非常に重いテールになります。私のような怠け者のためだけに、ここにこれらの2つのヒストグラムを追加できますか?nkχ2(k)k(n)kn
ドミトリーチェロフ

@Dmitrijシミュレーションは高速であるため(ヒストグラムの描画に時間がかかります)、12個追加しました。
whuber

図の場合は+1。イラストはいつも見やすいです。
ドミトリーチェロフ

7

2番目の質問に答えます。中心極限定理は、2乗または非2乗のiidシーケンスに対するものです。あなたの場合、場合、k

TkE(t1)2kVar(t12)N(0,1)

Et12Var(t12)nt121n自由度。したがって、ウィキペディアのページから平均と分散の式を取得できます。最終結果は次のとおりです。

Tknn2k2n2n1n22n4N01


1
Hotelling's T^2: (f − d + 1)/fd T^2 ∼ F (d , f + 1 − d )
DWin

1
@DWin, not so sure that Hotelling's T2 is really applicable here. At least from formulas from wikipedia page it is not immediately clear that T in OP question can be represented as T2. Can you please elaborate on this more?
mpiktas

will search for a convolution of F(1,n)+F(1,n), afraid of some hypergeometric things, but have to be known somewhere.
Dmitrij Celov

I believe it reduces to your situation when the variance matrix is diagonal. The off-diagonal elements from a sample should be near zero if the samples were from Normal, but might not be exactly zero if from t. Nonetheless, you asked for something approximate, so I think the answer is probably F under that proviso.
DWin

@DWin: it sure does look like a Hotelling with diagonal covariance matrix, but I am somewhat confused: from first principles, it does not seem like the sum of F(1,n) RVs would be distributed like an F...
shabbychef
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.