仮説検定で帰無仮説を指定する方法


15

帰無仮説の質問を選択する方法の良い経験則は何ですか。たとえば、仮説Bが真であるかどうかを確認したい場合、Bをヌルとして、Bを対立仮説として、またはNOT Bをヌルとして使用する必要がありますか?質問が明確であることを願っています。私はそれが最小化したいエラー(タイプI?)と関係があることを知っていますが、明確な直感が構築されていないため、それがどうなるかを忘れ続けています。ありがとう。


みんな...素晴らしい反応。すべて役立つ。人々が興味を持っているという理由だけで、ウェブ上でこのレベルのコラボレーションを得るとき、それはまだ私を驚かせます。わあ...ありがとう!
ネストール

回答:


17

私の良いアドバイザーからの経験則は、Null-Hypothesisを、あなたが真実になりたくない結果、つまり、あなたが正反対に見せたい結果に設定することでした。

基本的な例:新しい治療法を開発し、実際にプラセボよりも優れていることを示したいとします。あなたが帰無仮説を設定して新しいtreamentはプラセボと同等またはそれより悪いですし、対立仮説H 1=新しい治療をプラセボよりも優れています。H0:=H1:=

これは、統計的検定の過程で、帰無仮説を拒否する(および対立仮説を支持する)か、拒否できないためです。あなたの「目標」はヌル仮説を拒否することなので、あなたはそれを真実になりたくない結果に設定します。

サイドノート:Null-Hypothesisが拒否されるまで、それをひねって破るための統計的テストを設定すべきではないことを認識しています。カジュアルな言語は、このルールを覚えやすくするためにのみ使用されました。

これも役立つ場合があります:統計的検定におけるp値とt値の意味は何ですか?および/またはコンピュータ科学者のための統計的仮説検定の良い紹介は何ですか?


6

仮説Bが興味深い仮説の場合、not-Bを帰無仮説として、nullの下で、レベルでnot-Bを誤って拒否するタイプIエラーの確率を制御できます。not-Bの拒否は、タイプIエラーを制御するため、Bを支持する証拠として解釈されます。したがって、not-Bが真である可能性は低いです。混乱しています...? α

ある集団の2つのグループで治療と治療なしの例を見てみましょう。興味深い仮説は、治療には効果があるということです。つまり、治療により治療群と未治療群の間に違いがあります。帰無仮説は差がないということであり、この仮説を誤って拒否する確率を制御します。したがって、治療効果がない場合に治療効果があると誤って結論付ける確率を制御します。タイプIIエラーは、治療効果がある場合に誤ってヌルを受け入れる確率です。

上記の定式化は、統計的検定のNeyman-Pearsonフレームワークに基づいており、統計的検定は、ケース、ヌル、および代替案の間の決定問題と見なされます。レベルは、テストを(独立して)繰り返した場合にタイプIエラーを起こす回数の割合です。このフレームワークでは、nullと代替の間に実際の正式な区別はありません。ヌルと代替を交換する場合、タイプIとタイプIIのエラーの確率を交換します。ただし、上記のタイプIIのエラー確率は制御しませんでした(治療効果の大きさによって異なります)。この非対称性のため、却下失敗したと言うことができます。α帰無仮説(代わりに帰無仮説を受け入れます)。したがって、否定できないという理由だけで帰無仮説が真であると結論付けることに注意する必要があります。

フィッシャーの有意性テストフレームワークでは、実際には帰無仮説のみが存在し、帰無仮説の下で、観測データの値を計算します。p値が小さいほど、nullに対する強力な証拠として解釈されます。ここで、帰無仮説は明らかにnot-B(治療の効果なし)であり、p値は帰無に対する証拠の量として解釈されます。p値が小さいと、nullを自信を持って拒否し、治療効果はなく、治療効果があると結論付けることができます。このフレームワークでは、nullのみを拒否するか、拒否しない(受け入れない)ことができ、nullを偽造することがすべてです。なお、Pppppp-valueは、(想像上の)繰り返しの決定によって正当化される必要はありません。

どちらのフレームワークにも問題がないわけではなく、用語が混同されることがよくあります。さまざまな概念を明確に扱うためのRichard M. Royallによる尤度パラダイムという統計的証拠の本をお勧めします。


5

"frequentist"応答は、 "not B"という形式の帰無仮説を考案し、Steffenの応答のように "not B"に反論することです。これは「あなたは間違っているので、私は正しいに違いない」という議論を論理的に行うことです。これは、政治家の推論の一種です(つまり、相手は悪いので、私たちは良いです)。このような推論の下で複数の選択肢を扱うことは非常に困難です。これは、「あなたは間違っているので、私は正しい」という議論は、両方が間違っている可能性がない場合にのみ意味があるためです。

「ベイジアン」応答は、あなたが持っている証拠を条件に、テストに興味があるという仮説の確率を単純に計算することです。常にこれには事前の情報が含まれています。これは、問題を適切に提起するために行った仮定にすぎません(すべての統計手順は事前の情報に依存し、ベイジアンのものはそれらをより明確にします)。また、通常はいくつかのデータで構成されており、ベイズの定理により

P(H0|DI)=P(H0|I)P(D|H0I)kP(Hk|I)P(D|HkI)

H0H0「代替」です。それらが異なるように見えるのは、「null」と「alternative」という言葉によって暗示される意味だけです。2つの仮説がある場合、「ネイマンピアソン補題」の場合に等価性を示すことができます。これは単純に尤度比であり、上記のベイズ定理のオッズを取ることで一度に与えられます。

P(H0|DI)P(H1|DI)=P(H0|I)P(H1|I)×P(D|H0I)P(D|H1I)=P(H0|I)P(H1|I)×Λ

H0Λ>Λ~Λ~H1L2L1L1L2

Λ1<Λ~1


3
その最初の段落は、仮説検定への古典的なアプローチのパロディです。
whuber

仮説検定は、常に意思決定の問題ではありません。多くの場合、そのように定式化されますが、科学では、nullが偽であり、どれだけの量であるかを文書化することが問題かもしれません。言葉遊びゲームは、この目的を思い出させるものだと思います。この観点から、拒否に失敗することは、受け入れる決定ではなく、拒否するデータに証拠がないことです。
-NRH

@NRH-私は同意しますが、それは必ずしも目的ではありません。新しい理論をテストしたい場合は、それが真実である可能性を知りたいだけでなく、それが間違っている可能性を知りたいのです。そして、仮説テストは常に直接決定につながるとは限りませんが、最終的に決定につながらない場合、テストに悩むのは時間の無駄のようです。実際、あなたはすでにコメントに決定を定式化しています:「nullが偽であるかのように振る舞う」。これに代わる方法は1つだけです:「nullがtrueであるかのように動作する」選択肢が複数ある場合、仮説
確率

(続き)..テストは十分に定義されておらず、いわば「数学的に不適切」です。この決定には大きな不確実性があるかもしれませんが、他の選択肢はありません。不適切な/曖昧な問題がない限り、nullは同時に真でも偽でもありません。しかし、この場合、仮説検定は無意味です-適切な結論はありません。
確率

(暴言を続ける)-そして、目標が単にnullに対する証拠を定量化することである場合、仮説検定は必要ありません。これがp値の目的です。受け入れたり拒否したりする必要はなく、その値を報告するだけです。
確率の

1

帰無仮説は一般に、応答変数の違いはエラーのみによるものであると想定する必要があります。

AxH0Ax

この帰無仮説を棄却しないと、次のように解釈されます。

1)の違いはxエラーのみによるものであり、そうではない、Aまたは

2)データが存在していても違いを検出するには不十分である(以下のタイプ2エラーを参照)。

HaAx

H0AxH0Ax


1
3番目の段落、nullを拒否しないということはnullがtrueであることを意味するように見えますが、明らかにそれは間違っています。
whuber

@whuber-良い点、これを反映するように答えを編集します
-DQdlM
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.