帰無仮説はどれですか?科学理論、論理、統計の間の矛盾?


20

帰無仮説を設定する際の基礎となるロジックを理解するのが困難です。この回答では、明らかに一般に受け入れられている命題は、帰無仮説は効果がないという仮説であり、すべてが同じままである、つまり、太陽の下では何も新しいものではないというものです。

対立仮説は、あなたが証明しようとするものです。例えば、新薬はその約束を果たします。

今、科学理論と一般的な論理から、命題を偽造することしかできないことを知っています、私たちは何かを証明することはできません(すべての白鳥が白であることを証明できる白い白鳥はいませんが、黒い白鳥はそれを反証することができます)。これが、対立仮説を証明することと同等ではない帰無仮説を反証しようとする理由です-そして、これが私の懐疑論が始まるところです-私は簡単な例を挙げます:

カーテンの後ろにどんな動物がいるかを知りたいとしましょう。残念ながら、私は動物を直接観察することはできませんが、この動物の足の数を調べるテストを行っています。今、私は次の論理的推論を持っています:

動物が犬の場合、4本の脚があります。

私がテストを実施し、4本の足があることがわかった場合、これが犬(馬、サイ、または他の4本足の動物である可能性がある)であるという証拠にはなりません。しかし、私はそれが持っていないことがわかった場合足が4本、これは犬になれないという明確な証拠です(健康な動物を想定)。

薬剤の有効性に変換カーテンの後ろの薬剤が有効かどうかを調べたい。私が得る唯一のものは、私に効果を与える数字です。効果が正の場合、何も証明されていません(4脚)。効果がない場合、私は薬の有効性を反証します。

これをすべて言って-私は思う-一般的な知恵に反して-唯一の有効な帰無仮説は

薬は効果的です(例:薬が効果的であれば効果が見られます)。

私が反証できるのはこれだけだからです。次のラウンドまで、より具体的になるように努めます。したがって、効果を述べるのは帰無仮説であり、対立仮説はデフォルトです(効果なし)。

統計的検定で逆になっているように見えるのはなぜですか?

PS:上記の仮説を否定して有効な同等の仮説を得ることができないので、論理的に同等の形式は「効果が見られない場合、薬は有効ではない」ため、帰無仮説として「薬は有効ではありません」とは言えません結論はあなたが見つけたいものだからです。

PPS:これまでの答えを読んだ後の明確化のために:科学的理論を受け入れ、ステートメントを偽造することしかできず、それを証明できない場合、論理的に一貫している唯一のことは、新しい理論として帰無仮説を選択することです-偽造。現状を偽造した場合、手ぶらで放置されるためです(現状は反証されますが、新しい理論は証明されていません!)。そして、あなたがそれを偽造し損なうならば、あなたはどちらのより良い位置にでもありません。


3
ヒント:「薬は効果的です」は、科学的または統計的記述として十分に定量化されていません。 どのように定量化するのですか?
whuber

1
@whuber:これは私の問題の中で最も小さいです。例えば、血液の前測定が10%低下していると言ってください。これは帰無仮説でなければならない、と主張します-対立仮説は「何も起こらない」です。
vonjd

9
それどころか、これが問題の核心です。統計では、効果が-10%であるというnullを設定することはまったく問題ありません。あなたの実験は、それとは反対に十分に強力な証拠を生成する場合、それを拒否することができます。ただし、(並外れた計算的および概念的機構を除いて)実験ごとにこのような仮説を1つしかテストできないことに注意してください。また、エフェクトサイズがどのくらいになるかを非常に正確に知っているのは珍しい実験者であることに注意してください(ただし、テストする必要があると感じています!)。
whuber

3
まあ、実際の薬物試験では、ヌルは通常「現在の治療法よりも効果がない」と解釈され、代替法は「現在の治療法よりも効果がある」と解釈されます。ちなみに、これには組み込みのエフェクトサイズがあります。この処方では、証拠のための薬剤の有効性は、ヌルを拒否することができます。仮説を入れ替えると、有効性の証拠は、薬物が良好であるという主張を拒否することを思いとどまらせるだけです。最初のケースでは、立証責任がはるかに厳しくなります。
whuber

1
@vonjd:あなたは、「現状を偽造した場合、手ぶらで残されている」と言います。違う。「犬」/「犬ではない」という定性的な判断を行っていた場合、「犬ではない」という証拠を提供することが「犬」の特に強力な証拠ではないことは事実です。しかし、これは物を定量化する価値です。「0ではない」という証拠を提供する場合、値が0以外であることの良い証拠を提供します。良い効果と悪い効果の等しい証拠を提供することに懸念がある場合は、片側検定を使用します。
ラッセルピアス

回答:


12

統計には、同等性のテストと、より一般的なNullのテストがあり、それに対して十分な証拠があるかどうかを判断します。等価性テストは、これをその頭とNullとして効果が異なると仮定し、このNullに対して十分な証拠があるかどうかを判断します。

あなたの麻薬の例は明確ではありません。応答が効果の値/指標である場合、0の効果は効果がないことを示します。それをヌルとして設定し、これに対する証拠を評価します。効果がゼロと十分に異なる場合、効果のない仮説はデータと矛盾すると結論付けます。両側検定では、Nullに対する証拠として効果の十分に負の値がカウントされます。片側検定では、効果は正であり、ゼロとは十分に異なるため、より興味深い検定になるかもしれません。

効果が0であるかどうかをテストする場合は、これを反転させて、H0がゼロに等しくないという等価テストを使用する必要があります。代替方法は、H1 =効果= 0です。効果が0とは異なるという考えに対して証拠を評価します。


9
ここでの問題の一部は、IIRCでNullとして効果なしを選択する理由は、その効果のパラメーターがわかっているためです0。これを好転させて、Nullとしてゼロ以外の効果を持たせたい場合、このパラメーターの値が母集団全体に対して何であるかを事前に知る必要があります。また、人口はテストする意味がありません。
モニカの復活-G.シンプソン

さて、対立仮説についても同じ問題を抱えているようです(そこのパラメーターもわかりません)。だから私の質問は:なぜ両方を交換しないのですか?これは論理的に一貫しているようです。
vonjd

同等性テストについて他の人にコメントしてもらいます。それらは標準的なテストで仮説を交換することと同じではありませんが、私はそれらのアイデアにそれほど精通していません。同等性テストがコメントで言及した問題に苦しんでいるということは正しいとは思わない。それらは非常に異なる理論的観点から定式化されています。
モニカの復職-G.シンプソン

5

これは、頻繁な統計があなたが実際に尋ねたい質問に直接答えることができない別のケースだと思うので、微妙に異なる質問に答えます(そうではありません)、これを直接の答えとして誤解するのは簡単ですあなたが実際に聞きたかった質問。

私たちが本当に聞きたいのは、通常、対立仮説が真である確率(または、おそらく帰無仮説よりも真である可能性が高いこと)です。ただし、頻度論者の分析では、根本的にこの質問に答えることはできません。頻度論者については、確率は長期的な頻度であり、この場合、長期的な頻度を持たない特定の仮説の真実に興味があります。真実かそうでないか。一方、ベイジアンこの質問に直接答えるます。ベイジアンに関しては確率はある命題の妥当性の尺度であるため、ベイジアン分析では確率を特定の仮説の真理に割り当てることは完全に合理的です。

頻度の高い人が特定のイベントに対処する方法は、それらをある(おそらく架空の)集団からのサンプルとして扱い、特定のサンプルに関する声明の代わりにその人口について声明を出すことです。たとえば、特定のコインが偏っている確率を知りたい場合、Nフリップを観察し、h頭とt尾を観察した後、頻繁な分析ではその質問に答えることはできませんが、分布からのコインの割合を知ることができますN回ひっくり返したときにh以上の頭を与える公平なコイン。私たちが日常生活で使用する確率の自然な定義は一般に、頻繁なものではなくベイジアンのものであるため、これを帰無仮説(コインが偏っていない)である可能性として扱うのは非常に簡単です。

本質的に頻繁な仮説検定には、暗黙の主観主義的なベイジアン要素が中心に潜んでいます。頻繁な検定では、帰無仮説の下で少なくとも極端に統計を観察する可能性がわかりますが、これらの理由で帰無仮説を拒否する決定は完全に主観的であり、そうするための合理的な要件はありません。本質的な経験は、p値が十分に小さい場合(再びしきい値が主観的である場合)、通常、nullを拒否するための合理的な根拠に基づいていることを示しています。AFAICSそれは科学の哲学や理論にうまく適合せず、本質的には発見的です。

しかし、それは悪いことではありませんが、頻度の高い仮説のテストは、研究が乗り越えなければならないハードルを提供します。ですから、私は心の中でベイジアンですが、私は今でも定期的に(少なくともジャーナルの査読者がベイジアンの代替案に慣れるまで)頻繁に仮説検定を使用しています。


3

Gavinの答えに追加するには、いくつかのことを行います。

最初に、命題は偽造することしかできないが、証明することはできないという考えを聞いたことがあります。これについての議論へのリンクを投稿してもらえますか?ここでの私たちの言葉遣いでは、あまりうまくいけないようです-Xが命題なら、not(X)も命題です。命題の反証が可能な場合、Xの反証はnot(X)の証明と同じであり、私たちは命題を証明しました。

test+

薬には効果的である(すなわち:場合に限っ薬が有効であるあなたが効果が表示されます)。

test+test+|有効)、仮説検定と適切な統計モデルを使用する限り。仮説検定は、以下の肯定的な検定結果の可能性を形式化します。H0。しかし、効果的な薬は陽性検査を保証しません。薬が効果的で分散が大きい場合、テストでその効果を隠すことができます。

あなたが観察した場合 test+ 代替手段は H0、そして仮説検定はP(test+|H0)<0.05。

したがって、犬の場合と有効性の場合の違いは、証拠から結論までの推論の適切さにあります。犬の場合、犬を強く示唆しない証拠がいくつかあります。しかし、臨床試験のケースでは、有効性を強く示唆するいくつかの証拠があります。


1
ありがとうございました。文を改ざんすることしかできないが、それらを証明することはできない(1秒でリンクする)ことを受け入れる場合、論理的に一貫している唯一のことは、新しい理論として帰無仮説を選択することです。現状を改ざんした場合、手ぶらのままです(現状は反証されますが、新しい理論は証明されていません!)。リンクについては、良い出発点は次のようになると思います。 en.wikipedia.org/wiki/Falsifiability
vonjd

2
ここで言及すべきポイントは、帰無仮説を証明または反証していないということです。(古典的に)行う決定は、帰無仮説を保持するか拒否するかです。帰無仮説を拒否するとき、あなたはそれを反証していません。あなたがしていることは、観測されたデータを考えると、帰無仮説はありそうもないということです。
ラッセルピアス

@drknexus:さて、これが論理の改ざんの確率論的な同等物であることに同意しませんか?
vonjd

4
@drknexus「観測されたデータが与えられた場合、帰無仮説はありそうもない」と言うのではなく、「帰無仮説が真であれば、このデータはありそうもない」と言う方が正確ではないでしょうか?これら2つを統計的仮説検定の典型的な間違いとは思わないか?
マイケル

1
MM:そのとおりです。私は言葉遣いがだらしないようになりました。
-russellpierce

3

ある意味で、頻繁な仮説検定では逆になっているというのは正しいことです。私はそのアプローチが間違っていると言っているのではなく、研究者が最も興味を持っている質問に答えるように結果が設計されていないことが多いということです。ベイズ推定を

拒否または拒否に失敗する可能性がある「帰無仮説」について話す代わりに、ベイジアン推論では、現在の状況の理解に基づいた事前の確率分布から始めます。新しいエビデンスを取得すると、ベイジアン推論により、エビデンスを考慮に入れて信念を更新するためのフレームワークが提供されます。これは、科学がどのように機能するかに似ていると思います。


3

ここに根本的なエラーがあると思います(仮説検定の全領域が明確ではないということではありません!)が、代替案は私たちが証明しようとするものだと言います。しかし、これは正しくありません。nullを拒否(改ざん)しようとします。nullがtrueの場合、取得した結果が非常に低いと思われる場合は、nullを拒否します。

さて、他の人が言ったように、これは通常、私たちが尋ねたい質問ではありません:通常、nullがtrueの場合、結果がどのくらいありそうかを気にしません。



2

@DocによるPaul Meehlの言及を拡張します。

1)帰無仮説により研究仮説の反対を検証するため、「形式的に無効な」引数である結果のみを確認できます。結論は必ずしも前提から来るわけではありません。

If Bill Gates owns Fort Knox, then he is rich.
Bill Gates is rich.
Therefore, Bill Gates owns Fort Knox.

http://rationalwiki.org/wiki/Affirming_the_consequent

理論が「この薬は回復を改善する」であり、回復の改善を観察する場合、これはあなたの理論が真実であると言うことができるという意味ではありません。回復が改善されたように見えるのは、他の理由が考えられます。患者または動物の2つのグループは、ベースラインでまったく同じものではなく、研究中にさらに変化します。ランダム化は、ベースラインでの未知の交絡因子の深刻な不均衡を「守る」ため、これは実験的研究よりも観察上の大きな問題です。ただし、ランダム化は実際に問題を解決しません。交絡が不明な場合、「ランダム化防御」が成功した程度を示す方法がありません。

また、表14.1と、それ自体では理論をテストできない理由の説明も参照してください(常に付随する補助因子があります)。

ポール・ミール。「問題は統計ではなく認識論である:有意性検定を信頼区間で置き換え、危険な数値予測の精度を定量化する」 LL Harlow、SA Mulaik、およびJH Steiger(編)で、有意性検定がなかった場合はどうなりますか?(pp。393–425)マフア、ニュージャージー州:Erlbaum、1997。

2)何らかのタイプのバイアスが導入された場合(たとえば、いくつかの交絡因子の不均衡)、このバイアスがどの方向にあるのか、またはどの程度強いのかはわかりません。最善の推測は、回復率がより高い方向に治療グループをバイアスする可能性が50%あるということです。サンプルサイズが大きくなると、有意差検定がこの差を検出する可能性が50%あり、データを理論を裏付けるものとして解釈します。

この状況は、「この薬は回復をx%改善する」という帰無仮説の場合とはまったく異なります。この場合、バイアス(動物と人間のグループを比較する際に常に存在すると思います)が存在すると、理論を拒否する可能性が高くなります。

可能な限り極端な測定値によって制限される可能性のある結果の「空間」(Meehlは「Spielraum」と呼びます)を考えてください。おそらく0〜100%の回復があり、1%の分解能で測定できます。一般的な有意性テストの場合、理論と一致するスペースは、観察できる結果の99%になります。特定の差を予測する場合、理論と一致する空間は可能な結果の1%になります。

別の言い方をすれば、mean1 = mean2の帰無仮説に対する証拠を見つけることは、薬物が何かをするという研究仮説の厳しいテストではないということです。mean1 <mean2のヌルはより良いですが、それでもあまり良くありません。

ここの図3および4を参照してください:(1990)。理論の評価と修正:ラカトシアンの防衛戦略と、それを使用することを保証する2つの原則。Psychological Inquiry、1、108-141、173-180


0

すべての統計は、自然の世界では何も特定されていないという仮定を前提としているわけではありません(人工ゲーム&cの世界とは異なります)。言い換えれば、それを理解するための唯一の方法は、あるものが別の物と相関し、これが0から1の間で変化する確率を測定することです。しかし、もちろん無数の異なる状況。そして、同じ理由でゼロになったことを知ることはできません。自然の現実を理解するためのより信頼性の高いアプローチです。数学は、絶対的でほとんど方程式に依存していますが、文字通り、方程式のLH側= RH側、逆転する可能性があり、何も学習しません。厳密に言えば、静的な世界にのみ適用され、本質的に乱れた「自然な」世界には適用されません。したがって、帰無仮説は、自然そのものを理解するために使用される場合はいつでも、数学を引き受ける必要さえあります。


0

問題は「本当」という言葉にあると思います。自然界の現実は、時間が経つと無限に複雑で無限に変化するため、本質的に認識できません。そのため、自然に適用される「真実」は常に条件付きです。私たちにできることは、繰り返し実験することで変数間の可能性のある対応のレベルを見つけようとすることです。現実を理解しようとする試みでは、秩序のように見えるものを探し、心の中でそれを概念的に意識したモデルを構築して、賢明な決定を下すのを助けます予想外。帰無仮説は、現実を理解しようとする私たちの試みにおける唯一の信頼できる出発点です。


1
2つの答えをマージする必要があると思います。
vonjd

-1

棄却する帰無仮説を選択する必要があります。

仮説のテストシナリオには重要な領域があるため、仮説の下の領域が重要な領域にある場合は仮説を拒否し、そうでない場合は仮説を受け入れます。

したがって、受け入れたい帰無仮説を選択するとします。そして、帰無仮説の下の領域は臨界領域の下にないので、帰無仮説を受け入れます。しかし、ここでの問題は、帰無仮説の下の領域が許容可能な領域の下にある場合、対立仮説の下の領域が許容可能な領域の下にないということではありません。そして、これが当てはまる場合、結果に関する解釈が間違っています。したがって、その仮説を棄却したい帰無仮説としてのみとらなければなりません。帰無仮説を棄却できる場合、対立仮説が真であることを意味します。しかし、帰無仮説を棄却できない場合、2つの仮説のいずれかが正しい可能性があることを意味します。その後、別の検定を行うことができます。この検定では、対立仮説を帰無仮説として使用できます。その後、拒否することができます。対立仮説(現在は帰無仮説です)を拒否できる場合、最初の帰無仮説は真であると言えます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.