不等分散のt検定における非整数の自由度の説明


15

SPSS t-Testプロシージャは、2つの独立した平均を比較するときに2つの分析を報告します。1つの分析は等分散を仮定し、もう1つは等分散を仮定しません。等しい分散が仮定される場合の自由度(df)は、常に整数値(およびn-2に等しい)です。等分散が仮定されていない場合のdfは非整数(11.467など)であり、n-2の近くにはありません。これらの非整数dfの計算に使用されるロジックと方法の説明を求めています。


3
フロリダ大学のPowerPointプレゼンテーションには、スチューデントt統計のサンプリング分布へのこの近似が、不等分散の場合にどのように導出されるかについての適切な説明が含まれています
whuber

ウェルチのt検定は常により正確ですか?ウェルチのアプローチを使用することには欠点がありますか?
ジョエルW. 14

ウェルチと元のt検定で劇的に異なるpが得られる場合、どちらを選択すればよいですか?分散の差のp値が.06だけで、2つのt検定のp値の差が.000と.121である場合はどうなりますか?(これは、2つのグループの1つに分散がなく、25の別のグループに70,000の分散がある場合に発生しました。)
ジョエルW. 14

2
値に基づいてそれらを選択しないでください。等しい分散を仮定する(データを見る前に)正当な理由がない限り、単純にその仮定をしないでください。p
Glen_b -Reinstateモニカ

1
質問はすべて、ウェルチテストを使用するタイミングに関連しています。この質問はstats.stackexchange.com/questions/116610/に
ジョエルW.

回答:


11

Welch-Satterthwaite dfは、2つの自由度のスケーリングされた重み付き調和平均であり、重みは対応する標準偏差に比例することを示すことができます。

元の式は次のとおりです。

νW=(s12n1+s22n2)2s14n12ν1+s24n22ν2

は、i 番目のサンプル平均の推定分散または平均のi番目の標準誤差の二乗であることに注意してください。ましょうR = R 1 / R 2そう、(サンプル手段の推定された分散の比)ri=si2/ni番目r=r1/r2

νW=(r1+r2)2r12ν1+r22ν2=(r1+r2)2r12+r22r12+r22r12ν1+r22ν2=(r+1)2r2+1r12+r22r12ν1+r22ν2

第一の要因は、から増加し、1R = 02、R = 1、その後に減少1R = log rで対称です。1+sech(log(r))1r=02r=11r=logr

2番目の要因は、重み付き調和平均です。

H(x_)=i=1nwii=1nwixi.

DFの 2 DFに対する重みでありますwi=ri2

どのとき、言うことである非常に大きく、それが収束するν 1。場合、R 1 / R 2が非常に近くにある0が収束するν 2。とき、R 1 = R 2あなたはDFの倍の調和平均を取得し、ときsは2 1 = S 2 2を、あなたはまたのために可能な最大値であり、通常の等分散t検定のDF、取得ν Wをr1/r2ν1r1/r20ν2r1=r2s12=s22νW

-

等分散t検定では、仮定が成り立つ場合、分母の2乗はカイ2乗のランダム変量の定数倍です。

ウェルチt検定の分母の2乗は(一定の時間で)カイ2乗ではありません。ただし、近似値としてはそれほど悪くないことがよくあります。ここで関連議論を見つけることができます

教科書スタイルの派生については、こちらをご覧ください


1
調和平均に関する優れた洞察。これは、比率の平均化に算術平均よりも適切です。
フェリペG.ニービンスキー16

10

ttttts12/n1s22/n2t


1つのt検定では、SPSSはdfを26.608として報告しますが、2つのグループのnは22と104です。(標準偏差は、小グループと大グループでそれぞれ10.5と8.1です。)
ジョエルW. 14

2
s12/n1s22/n2n

の相対的なサイズの関係を拡張すると思います s2/nウェルチdfの回答(コメントに収まらないため)。
Glen_b -Reinstateモニカ

1
@Glen_b、それはここで大きな価値があると確信しています。
GUNG -復活モニカ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.