片側仮説検定の正当化


35

両側仮説検定を理解しています。があり(vs.)。 -値は確率である観察されたものなど、極端として、少なくともデータを生成します。H0:θ=θ0H1=¬H0:θθ0pθ

片側仮説検定が理解できません。ここで、(vs.)。p値の定義は上記から変更されてはなりません。それは、少なくとも観測されたものと同じくらい極端なデータを生成する確率であるべきです。しかし、我々はありません知っているそれがで上位囲まれた唯一のこと、。H0:θθ0H1=¬H0:θ>θ0θ θθ0

したがって、代わりに、(では)と仮定し、これが少なくとも観測されたものと同じくらい極端なデータを生成する確率を計算しますが、一方の端でのみ。技術的には、これは仮説とは無関係のようです。θ=θ0θθ0H0

さて、これは頻度論的仮説のテストであり、頻度論者は事前分布を置かないことを理解しています。しかし、それは単に、上記の計算を写真に当てはめるのではなく、仮説を受け入れたり拒否したりすることが不可能であることを意味するのではないでしょうか?θ


同様の問題は、その後頼まれたstats.stackexchange.com/questions/8196/...
ロビンはジラール

1
値の定義が不完全です。読むべきです(強調を追加):p値は、帰無仮説がtrueであると仮定して、θが少なくとも観測されたものと同じくらい極端なデータを生成する確率ですppθ
アレクシス14

回答:


34

それは思慮深い質問です。多くのテキスト(おそらく教育学的な理由による)がこの問題について書かれています。実際に起こっているのは、があなたの一方的な状況における複合的な「仮説」であるということです。それは実際には単一の仮説ではなく、仮説の集合です。それは必要であるという点で、すべての可能な仮説のためのH 0H0 H0、テスト統計がクリティカル領域に入る可能性は、テストサイズ以下でなければなりません。さらに、テストが実際に公称サイズを達成する場合(これは高出力を達成するのに良いことです)、これらの可能性(すべての帰無仮説を引き継ぐ)の上限は公称サイズに等しくなければなりません。実際には、ディストリビューションの特定の「良い」家族に関わる場所の単純なパラメータ・テストのために、このsupremumはパラメータを使用して仮説のために達成される。したがって、実際問題として、すべての計算はこの1つの分布に焦点を当てています。 ただし、セットH 0の残りの部分を忘れてはなりませんθ0H0:これは、両側テストと片側テスト(および一般的な「単純」テストと「複合」テスト)の重要な違いです。

これは、片側テストの結果の解釈に微妙に影響します。nullが拒否された場合、分布のいずれかである自然の真の状態に反する証拠を示すことができます。ヌルが拒否されない場合、観測データと「一貫性のある」H 0に分布が存在すると言うことができます。H 0のすべての分布がデータと一致していると言っているわけではありません。それらの多くは、極めて低い可能性をもたらします。H0H0H0


あなたが言ったことはすべて有効で重要です。私が考えるもう一つの重要な側面は、通常、帰無仮説は興味のない仮説と見なされるということです。代替案は科学的仮説と見なされます。実験者が証明したいものです。私は通常、同等性テストと非劣性テストで異なるため、と言います。片側テストの問題に関しては、興味深いのはヌル値より大きいパラメーターを持つ側だけです。そのため、小なり側のすべての値はヌルに組み込まれます。
マイケルR.チェルニック

stats.stackexchange.com/questions/333301/… この質問に答えたい、または参考文献を教えてくれたら…;)
海の老人。

6

私が見として-値を最大種の過誤の確率。場合θ « θ 0、タイプIエラー率の確率は実質的にゼロかもしれないが、それは可能。ミニマックスの観点からテストを見るとき、敵はいずれにしても帰無仮説の「内部」の奥深くから引き出されることは決してなく、力は影響を受けません。単純な状況(たとえば、t検定)では、そのような片側帰無仮説を許可して、保証された最大タイプIレートで検定を作成することができます。pθθ0t


2

一方向の結果のみが到達しようとしている結論を支持する場合、片側仮説検定を使用します。

これはあなたが尋ねている質問の観点から考えてください。たとえば、肥満が心臓発作のリスクの増加につながるかどうかを確認するとします。10人の肥満者と10人の非肥満者で構成されるデータを収集します。今、記録されていない交絡因子、貧弱な実験計画、または単なる不運のために、肥満ではない人の8人と比較して、肥満の人10人のうち2人だけが心臓発作を起こしているとしましょう。

このデータに対して両側仮説検定を実施する場合、肥満と心臓発作のリスクとの間に統計的に有意な関連性(p〜0.02)があると結論付けられます。ただし、関連付けは、実際に表示されるはずの方向とは逆になるため、テスト結果は誤解を招く可能性があります。

(実際には、このような直感に反する結果を生み出した実験は、それ自体興味深い興味深い質問につながる可能性があります。たとえば、データ収集プロセスの改善が必要な場合や、職場での未知のリスク要因がある場合、または従来の知恵は単純に間違っているかもしれませんが、これらの問題は、どのような仮説検定を使用するかという狭い質問とは実際には関係ありません。


2

pH0H00.5H10.5

H0H00.75H10.25

H1H0H0

Rでこのおもちゃの例を試すことができます。また、異なる絶対数と頭と尾の組み合わせを試してください。

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.