分散分析(ANOVA)で片側検定F検定を使用する理由


13

分散分析テストで片側検定を使用する理由を教えてください。

ANOVAで片側検定(F検定)を使用する理由


2
あなたの思考を導くいくつかの質問...非常に負のt統計量はどういう意味ですか?負のF統計量は可能ですか?非常に低いF統計とはどういう意味ですか?高F統計とはどういう意味ですか?
ラッセルピアス

片側検定はF検定でなければならないという印象を受けているのはなぜですか?あなたの質問に答えるには:F検定では、パラメーターの複数の線形結合を使用して仮説を検定できます。
IMA

1
両側検定ではなく片側検定を使用する理由を知りたいですか?
イェンスクーロス

@tree信頼できるまたは公式のソースを構成するものは何ですか?
-Glen_b

1
@treeは、ここでのシンデレラの質問は、分散のテストに関するものではなく、具体的にはANOVAのF検定- 平均の等価性のテストであることに注意してください。分散の等価性のテストに興味がある場合は、このサイトの他の多くの質問で議論されています。(はい、このセクションの最後の文で明確に説明されているように、' プロパティ 'のすぐ上にあるように、分散テストでは、両方のテールに注意します
Glen_b -Reinstate Monica

回答:


17

Fテストは、次の2つの目的で最も一般的に使用されます。

  1. ANOVAでは、平均の等価性(および同様のさまざまな分析)をテストします。そして

  2. 分散の等価性のテスト

それぞれを順番に考えてみましょう。

1)ANOVAのF検定(および同様に、カウントデータの通常のカイ2乗検定)は、データが対立仮説と一致するほど、検定統計量が大きくなる傾向があり、一方、サンプルの配置ヌルと最も一致しているように見えるデータは、検定統計量の最小値に対応します。

3つのサンプル(サイズ10、サンプル分散が等しい)を検討し、サンプル平均が同じになるように配置してから、異なるパターンで平均を移動します。サンプル平均の変動がゼロから増加するにつれて、F統計量は大きくなります。

3つのサンプルの配置と対応するF統計量

黒い線()はデータ値です。太い赤い線()はグループ平均です。||

帰無仮説(母集団の平均)が真である場合、サンプル平均のばらつきが予想され、通常はF比が約1になることが予想されます。期待して...だからあなたは人口の平均が異なると結論付けるつもりはない。

つまり、ANOVAの場合、異常に大きなF値が得られた場合に平均値の仮説を拒否し、異常に小さな値が得られた場合に平均値の仮説を拒否しません(何かを示すかもしれませんが、人口が異なることを意味します)。

Fが上尾にある場合にのみ拒否することを確認するのに役立つ図を次に示します。

ANOVAのFの説明、F統計がアッパーテールにある場合は拒否

2)分散の等価性*(分散比に基づく)のFテスト。ここで、分子のサンプル分散が分母の分散よりもはるかに大きい場合、2つのサンプル分散推定値の比率は大きくなり、分母のサンプル分散が分子の分散よりもはるかに大きい場合、比率は小さくなります。

つまり、母分散の比率が1と異なるかどうかをテストするには、Fの大きい値と小さい値の両方でnullを拒否する必要があります。

*(このテストの分布仮定に対する高い感度の問題(より良い代替案があります)およびANOVA等分散仮定の適合性に関心がある場合、おそらくあなたの最良の戦略は正式なテスト。)


2
@TaylerJones Leveneのテストはやや堅牢です。Browne-Forsytheはより堅牢です(ただし、通常の近くでは少し電力が失われます)。フリグナー・キリーンもまたそうです。数十年にわたって、私はLeveneまたはBrowne-Forsytheをそれぞれ2回しか使用していません。(再び発生した場合、Brown-Forsytheのようなものが私に適している可能性がありますが、通常、複数のグループの分散の平等をテストする意味がありません。)
Glen_b -Reinstate Monica

2
申し訳ありません。ANOVAワンテールを使用する理由をまだ理解していません。より具体的には、あなたの議論から、帰無仮説の下では私は治療効果がないと理解し、その結果、はに近くなります。比率が大きくなります。しかし、それが「それがANOVAで片側検定を使用する理由である」ことをどのように暗示していますか?F=MSTREATMENTMSERROR1F
時間

2
@tree仮説検定についてもっと一般的には理解していないように聞こえますが、正確な場所を特定するのは困難です。大きいFを取得した場合は拒否し、小さいFを取得した場合は拒否しないことを理解していると言います。Fの大きな値は上部の値であり、Fの小さな値は下部の値です。値が大きい場合にのみ拒否します。つまり、下側ではなく上側にあります。どうしてそれが尾を引くのか見えないの?役に立つかもしれない別のプロットを含めます。
Glen_b

1
@jeramy私のコメントは、分散の比率に依存するテストに言及しています(具体的には、「ここでは、2つのサンプル分散推定値の比率は ...」と述べました)。参照するテストは、スプレッドの違いを見つけるために、あるロケーションメジャーから絶対残差のロケーションの違いを探します。それらは、自然に位置差のテストが機能する方法で機能します。私はあなたがケースを示そうとしているためだろう Fの下の尾を見て、ブラウン・フォーサイス(&他のいくつかのテストでは、推論の広がりの違いへの偏差のいくつかの指標内の位置の違いについて見てはことを)何の助けもないだろう
Glen_b -モニカの復元

1
@jeramyより明確にするためにいくつかの単語を追加しました。Brown-Forsythe、Leveneなど Fテーブルを使用ますが、テストの仮定の下であっても、テスト統計の分布は実際にはF分布ではないことに注意してください。
グレン_b-モニカを復元

2

ANOVAの目的は、平均の不等性をチェックすることであるということを理解する必要があります...これは、サンプル内の変動と比較して、サンプル間の大きな変動(および平均から変動が計算されるための手段)に関係していることを意味します(再び個々のサンプル平均から計算されます)。サンプル間の変動が小さい場合(F値が左側にある場合)、この違いはわずかであるため、問題ではありません。サンプル間の変動は、変動内よりも大幅に大きい場合に重要です。このような場合、F値は1より大きくなり、したがって、右尾になります。

唯一の問題は、なぜ重要性のレベル全体を右尾に置くのかということであり、答えは再び同様です。拒否は、F比が右側にある場合にのみ発生し、F比が左側にある場合には発生しません。有意水準は、統計的制限によるエラーの尺度です。拒否は右側でのみ発生するため、重大度(誤解のエラーリスク)全体が右側に保持されます。`


0

治療内の平均平方(MS)の期待値は母集団の分散であり、治療間のMSの期待値は母集団の分散に治療の分散を加えたものです。したがって、F = MSbetween / MSwithinの比率は常に1より大きく、1未満になることはありません。

片側検定の精度は両側検定よりも優れているため、片側検定を使用することをお勧めします。


最初の段落の最後の文の主張が正しいとは思わない... E(分子)> E(分母)は、分子>分母を意味しない。
Glen_b-モニカを

Glen_bの点を除けば、「片側検定の精度は両側検定よりも優れているため、片側検定を使用することを好みます」ということはわかりません。これが何を意味するのか説明できますか?精度について話すことは、その点を見逃しているように思えます。
シルバーフィッシュ

精度は、信頼区間の半分と同じです。同じF統計量について、1検定は、p値が小さい帰無仮説(実際には半分)を拒否します。逆に、1検定は、F-statの値が小さい帰無仮説を棄却できます。これは、1テールテストが、より少ないサンプルで、またはサンプルに存在するより一般的な原因の分散で、治療効果を検出できることを意味します。これにより、効果を探している場合、1テールテストがより望ましいものになります。
ジェフコッター

はい、計算されたF統計値は1.0未満になる場合があります。しかし、結論は「治療効果がない」という帰無仮説を否定することはできません。したがって、下部に重要な領域はありません。したがって、F検定は上側の片側検定です。ANOVAでは、論理引数はMS_treatおよびMS_errorの期待値に基づいています。「治療効果なし」仮説では、H0:E(MS_treat)= E(MS_error)=母分散。重大な治療効果が生じると、HA:E(MS_treat)> E(MS_error)になります。(ANOVAをカバーするMontgomeryのテキストを入手してください)。したがって、HAは片側検定を意味します。
ジェフコッター
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.