ウェルチt検定の自由度の報告


14

不等分散(Welch-SatterthwaiteまたはWelch-Aspinとも呼ばれます)のウェルチt検定は、一般に非整数の自由度を持ちます。テストの結果を報告するとき、これらの自由度はどのように引用されるべきですか?

さまざまな情報源*によると、「標準トンのテーブルに相談する前に最も近い整数に切り捨てするために、従来のです」 - 。保守的である、丸めのこの方向として理にかなっている。**一部の古い統計ソフトウェア(例えば、あまりにもこれを行うだろうグラフパッド・プリズムバージョンの前に6)といくつかのオンライン計算機はまだあります。この手順が使用されていた場合、切り捨てられた自由度を報告することが適切と思われます。(より優れたソフトウェアを使用することはさらに適切かもしれません!)

しかし、最新のパッケージの大部分は小数部分を使用しているため、この場合は小数部分を引用する必要があります。1000分の1の自由度はp値にごくわずかな影響しか与えないため、小数点以下2桁以上を引用するのが適切であるとは思えません。

Googleの学者を見てみると、dfを小数点以下1桁または2桁の整数として引用している論文を見ることができます。使用する精度についてのガイドラインはありますか?また、ソフトウェアは、完全な小数部を使用する場合、引用されたDFは丸められるべきダウン図形の所望の数(例えばに対して7.5845...7.5 1〜DPまたは7整数として)保存的計算と適切であったとして、または私にとってより賢明なように、7.5845 ... 7.6から1 dpまたは8が最も近い全体になるように、従来のように(最も近い)丸められますか?7.5845...7.68

編集:非整数dfを報告する最も理論的に健全な方法を知っていることは別として、人々が実際に何をしているを知ることも良いでしょう。おそらく、ジャーナルとスタイルガイドには独自の要件があります。私は、APAのような影響力のあるスタイルガイドが何を要求するのか興味があります。私が識別できることから(マニュアルはオンラインで無料で入手できません)、APAは一般的に、p値(2または3dpの可能性があります)およびパーセンテージ(最寄りパーセント) -カバー回帰スロープ、そのトンの統計、Fの統計、χ2統計など。これは非常に非論理的で、小数点以下2桁が非常に異なる有効数字を占め、982.47よりも2.47でかなり異なる精度を示唆しますが、非科学的なサンプルで見た小数点以下2桁のウェルチdfの数を説明するかもしれません。

eg GD、ラクストン不等分散t検定は、スチューデントのt検定およびMann-Whitney U検定の未使用の代替手段です。行動生態学(2006年7月/ 8月)17(4):688-690 doi:10.1093 / beheco / ark016

Welch-Satterthwaite近似自体は保守的である場合と保守的でない場合がありますが、保守的でない場合は、自由度を切り捨てても全体を補償する保証はありません。


1
私は実際の実践を研究していません-これがコメントであり答えではない理由です-しかし、私はそれが重要な数字の報告に関連する判断に基づいていることを期待しています。比較的高いdfの場合、多くの場合、小数点以下1桁を変更してもp値はまったく(レポートされる精度のレベルまで)変更されないため、整数への丸めは問題ありません。非常に低いDFのためのとの極値トン、派生| νt超えることができる0.01ような場合には示唆し、νはより一つだけ少ない有効数字に報告されるべきであるP自体。|νFν(t)|0.01νp
whuber

@whuberこれは、特にGlen_bの回答と一緒に使用した場合に、実際に役立つ観察結果です。 "非常に低い"はどれくらいですか?(私が出会った論文のサンプルからの私の疑いは、多くの「実際の練習」は「良い練習」と同じものではないかもしれないということです!一般的な報告ガイドラインが何であるかを知るために。)ν
シルバーフィッシュ14

回答:


10

私は実際の実践を研究していないので、この返信では質問のその側面に対処することはできません。一般原則として、自由度(df)を報告する際の有効数字の扱いは、有効数字に関連する判断に基づいていると予想されます。

原則は一貫していることです。関連する別の数量で使用される精度に適した精度を使用します。特に、xが小さな値hの最も近い倍数(h = 1などに与えられている場合、値およびy = f x )を報告する場合xy=f(x)xh小数点以下6桁で 2 ×106)、関数fによって媒介されるyの相対精度はh=12×106yf

suphkh|f(x+k)f(x)|h|ddxf(x)|.

が区間[ x h x + h ]で連続微分可能である場合、近似が適用されます。f[xh,x+h]

本出願でp値、xは自由度νypxν

y=f(x)=f(ν)=Fν(t)

どこウェルチ-Satterthwaite統計で、Fのνは、学生のCDFでのtと分布ν自由度。tFνtν

比較的高いDFのための(精度のレベルは、報告に)、多くの場合、小数点第一場所の変化は、すべてのp値を変更しないので、整数に丸めることは、微細である(H = 1 / 2が、H | Dνh=1/2非常に小さいです)。非常に低いdfおよび統計tの極値の場合、導関数の大きさ| h|ddxf(x)|t0.01を超えることができます。このような場合、νp自体よりも小数点以下1桁だけを報告する必要があることを示唆しています。|νFν(t)|0.01νp

最低(合理的な)dfおよび範囲の微分の大きさのこのラベル付き等高線図を自分参照してくださいt | これは興味深いことです(なぜなら、それらは低いp値につながる可能性があるからです)。|t|

図

ラベルは、導関数の10を底とする対数を示します。したがって、このプロットのk + 1 )の間のポイントで、小数点の後にj 番目の場所で報告されたdfを変更すると、おそらくj + k 番目以降でのみ報告されたp値が変更されます場所。たとえば、p値を10 6(小数点以下6桁)に丸めているとします。統計ν = 2.5およびt = 8を考慮してください。これらは近くに位置している- 3k(k+1)jth(j+k)th106ν=2.5t=83ログ輪郭。したがって、6 + 3 =小数点以下3桁で報告する必要があります。ν6+(3)=3

最も大きいの明るい青色の領域は、νの小さな変化がp値に最大の影響を与える場所を示すため、重要なものです。kν

(より高いDFのための状況でこれを対比30に示します)。430

図2

pの精度に対するの影響は、νが増加するにつれて急速に減少します。νpν


1
これは、自由度を丸める原則(+50!)を確立するのに非常に役立ちました。後の回答者が実際の練習についてのギャップを埋めることができることを願っています。
シルバーフィッシュ

7

標準のtテーブルを参照する前に、最も近い整数に切り捨てるのが一般的です

規則であった理由は、テーブルに非整数dfがないためです。さもなければそれをする理由はありません。

この調整は控えめなので、これは理にかなっています。

統計には実際にはt分布がありません。これは、二乗分母には実際にはスケーリングされたカイ2乗分布がないためです。これは、特定のインスタンスで保守的である場合とそうでない場合がある近似です。特定のインスタンスで統計の正確な分布を検討する場合、dfの切り捨ては保守的であるとは限りません。

(補間によって、または実際にそのdfでt分布の数値を計算することによって?)

t分布(cdfをt統計に適用)のp値は、さまざまな非常に正確な近似によって計算できるため、補間ではなく効果的に計算されます。

小数点以下3桁以上を引用するのが適切であるとは思えません

同意する。

使用する精度についてのガイドラインはありますか?

1つの可能性は、p値のウェルチ・サッタースウェイト近似がどの程度正確であるかを調査することです。その一般的な分散比は、dfに示唆されるよりもかなり高い相対精度を引用していません(dfの分母の2乗のカイ2乗は、いずれにしてもカイ2乗ではない何かの近似値を与えているだけです。


1
「切り捨ては保守的である」ことを明確にすべきでした。Welch-Satterthwaite近似自体は、保守的である場合とそうでない場合があります。しかし、切り捨てのプロセスは確かです-近似が最初に控えめなものでなかった場合、切り捨て後に少なくとも悪くはありません。対照的に、切り上げ(たとえば、「8に最も近い7.5845ラウンド」)は、控えめな調整ではありませ。これを表現するより良い方法を見つけることができますが、私のポイントが明確であることを願っています!
シルバーフィッシュ

「1つの可能性は、p値のウェルチ・サタースウェイト近似がその分散比の一般的な領域でどれほど正確であるかを調査することです」-これは非常に賢明であり、原則的なアプローチと思われます。これは一般的に行われていることですか?実装のためのいくつかのヒントがいいでしょう。実際には、ジャーナルスタイルガイドラインには最終的な決定権があることが多いと思います。しかし、私は彼らが何を言っているのかわからない-私の検索で判明した論文には間違いなくさまざまな実践があった。
シルバーフィッシュ

将来の読者への混乱を避けるために、質問の本文で保守的な丸めを明確にすることを試みました。それを拾ってくれてありがとう。
シルバーフィッシュ

私はそれが一般に行われているようなことはないと思いますが、それはそうあるべきではないとは思いません。特定のポイントにラウンド/トランケートする理由がどの程度説明されるかは、明らかにジャーナル/編集者/レフリーに依存します。
-Glen_b
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.