なぜ対立仮説が必要なのですか?


13

テストを行うと、2つの結果が生じます。

1)帰無仮説を棄却

2)帰無仮説を棄却できません。

対立仮説の受け入れについては触れません。対立仮説の受け入れについて話さない場合、なぜ対立仮説を立てる必要があるのでしょうか。

ここに更新があります: 誰かが私に2つの例を与えることができます:

1)帰無仮説を拒否することは、対立仮説を受け入れることと同じです

2)帰無仮説を拒否することは、対立仮説を受け入れることとは異なります


1
結論を出そうとしているからです。帰無仮説でない場合、多分それは対立仮説です(仮説を棄却すると、対立仮説が有効であるかどうかを完全に確信していなくても)。帰無仮説を棄却すると、対立仮説が真である可能性があると結論付けるいくつかの「証拠」があると言います。
nbro

@nbro、ありがとう、元の投稿に質問を追加しました。見ていただけますか?
user1700890

1
私は一般的に仮説検定に精通していません。より有能な人があなたの質問に答えるのを待つ方がいいです。
nbro

対立仮説が帰無仮説の補足である場合、まったく使用しても意味がありません。教科書以外の理由で、実際には代替仮説を使用する人はいません。
Aksakal

「私たちは対立仮説を受け入れることについて話しません」-すべての可能な「私たち」に当てはまるわけではありません。一部の人々は対立仮説の受け入れについて話し、他の多くの人それを言うことに対するタブーを尊重してもそれを考えます。それが真実であるという合理的な疑いがない場合に対立仮説を受け入れることについて話すことを避けることは、いくぶん面倒です。しかし、統計は非常に誤用されやすいので、この場合、結果の解釈に注意を喚起する限り、ペダントリーはおそらく良いことです。
John Coleman

回答:


7

「対立仮説の受け入れについて話さない場合、なぜ対立仮説を立てる必要があるのでしょうか?」に焦点を当てます。

これは、意味のあるテスト統計を選択し、調査が高出力になるように設計するのに役立つためです。選択肢がなければ、私たちは権力の概念を持っていません。

帰無仮説のみがあり、代替案がないとします。その場合、強力な検定統計量を選択する方法に関するガイダンスはありません。私たちが言えることは、「値がnullを下回る可能性が低いテスト統計を観察するときは常にnullを拒否すること」です。任意のものを選択できます。Uniform(0,1)の乱数を描画し、0.05未満の場合はnullを拒否できます。これはnullが「まれに」発生する確率は5%未満ですが、nullがfalseの場合もまれです。したがって、これは技術的には統計的検定ですが、何かに対するまたはそれに対する証拠としては無意味です。

その代わり、通常、我々はいくつかの科学的妥当な代替仮説を持っている(「存在である私の実験で治療群と対照群の間での成果に正の差が」)。悪魔の提唱者として帰無仮説を提起する可能性のある批評家に対して、それを擁護したいと思います(「私はまだ確信していません---おそらく、あなたの治療は実際に傷ついているか、まったく効果なく、データはサンプリング変動のみによるものです」)。

これらの2つの仮説を念頭に置いて、代替の下での典型的な値がnullの下ではありそうもない検定統計量を選択することにより、強力な検定をセットアップできます。(0から遠い正の2サンプルt統計は、代替がtrueの場合は驚くべきではありませんが、nullがtrueの場合は驚くべきです。)次に、nullの下での検定統計量のサンプリング分布を把握し、p値を計算できるようにします。 ---そしてそれらを解釈します。nullの可能性が低いテスト統計を観察する場合特に、研究デザイン、サンプルサイズなどが高い検出力を持つように選択されている場合、これは代替案のいくつかの証拠を提供します。

それでは、対立仮説を「受け入れる」ことについて話しませんか?強力な研究でさえ、ヌルが間違っているという完全に厳密な証拠を提供しないからです。それはまだ一種の証拠ですが、他のいくつかの種類の証拠よりも弱いです。


7

歴史的に、対立仮説が必要かどうかについては意見の相違がありました。この不一致の点について、頻度論的統計とベイジアンの回答という文脈の中で、フィッシャーとネイマンの意見を検討することで説明しましょう。

  • フィッシャー -対立仮説は必要ありません。適合度テストを使用して、帰無仮説を簡単にテストできます。結果は値であり、帰無仮説の証拠の尺度を提供します。p

  • ネイマン-nullと代替案の間で仮説検定を実行する必要があります。テストは、固定された事前に指定されたレートでタイプ1エラーが発生するようなテストです。結果は、レベルで帰無仮説を棄却するか否かを決定することです。αα

    決定理論の観点からの代替案が必要です。2つのアクションコースから選択します。テストの力を報告する必要があるためです 代替案が真の場合に を拒否する可能性が最も高い、最も強力なテストを探す必要があります。

    1p(Accept H0|H1)
    H0

    これらの両方の点を満たすために、仮説は漠然とした 'not ' 仮説にはなりません。H0

  • ベイジアン -少なくとも2つのモデルを検討し、それらの相対的妥当性をデータで更新する必要があります。モデルが1つだけの場合、 収集するデータに関係なく、ます。このフレームワークで計算を行うために、仮説(またはこのコンテキストで知られているモデル)は、不適切に定義された「not」のものではありません。モデル書き込めないため、私はそれを不適切な定義と呼び。

    p(H0)=1
    H0p(data|not H0)


1
あなたの最後のポイントは素晴らしいものであり、単一のやる気のないNHSTに基づいてそれらの全体の議論の基礎となる出版物ではしばしば無視されます。
コンラッドルドルフ

'not 'が定義されていないのはなぜですか?H0
マイケル

それは何ですか?を計算できますか?p(data|notH0)
innisfree

@innisfreeは頻度主義の概念ではありませんが、おそらくベイジアンの概念です。
Michael

少なくとも2つのモデルを導入せずに試してみてください
innisfree

4

イムは、これが正式な要件ではなく、一般的であることを確認した場合、100%ではないよヌル仮説と代替網羅1)補完および2):仮説です。つまり、1)両方を同時に真にすることはできません。2)一方が真でない場合、もう一方も真でなければなりません。

女の子と男の子の間の身長の簡単なテストを検討してください。この場合の典型的な帰無仮説は、です。別の仮説は、です。つまり、nullが真でない場合、alternativeは真でなければなりません。heightboys=heightgirlsheightboysheightgirls


1
私はあなたの発言に完全に同意しますが、とはも一般に無限大の帰無仮説の集合であることに注意してください。また、とは網羅的である必要がないと多くの人が確信しているようです。たとえば、これまたはこの説明を参照してください。H0HaH0Ha
bi_scholar

2
@bi_scholarディスカッションスレッドをありがとうございます。私はこれの専門家ではありませんが、簡単な推論に​​基づいて、それらは徹底的である必要があると思います。この奇妙なテストについて考えてみましょう。道路上に5つの岩が順番に並んでいるのを見つけたとします。彼の:風がこれをしました。彼の:それはエイリアンでした。ここで、風がこれを行った可能性をテストし、0.0001の確率を見つけた場合、風の仮説を拒否します。しかし、それは彼がエイリアンであると主張する権利を彼に与えません。彼が主張できるすべてはそれが風である可能性が小さいということです。しかし、他の説明は未解決のままです。H0H1
KarolisKoncevičius19年

1
同意する。私の推論は、仮説検定はを拒否または受け入れる一方でを受け入れるまたは拒否することであるというもの。場合と網羅されない、任意の定義にはポイントはありません すべてでは、私たちが拒否してもいるので、お受けできませんので外の他の仮説が存在するとして、とも事実であるかもしれません。残念ながら、私は最初のスレッドで自分のポイントを理解することができませんでした。H0HaH0HaHaH0HaH0Ha
bi_scholar

1
@innisfreeは、ある種の尤度フレームワークで2点仮説をテストできます-確かに。しかし、その手順は「帰無仮説検定」と呼ばれることはなく、不正確です。どれも真でない場合でも、最も近いものを真として選択します。さらに、検出力に関して-テストの検出力を計算するときに、別の仮説または効果サイズを選択できますが、(私の見解では)テストが実行されたらそれを忘れるべきです。データに存在する可能性のある影響について彼に知らせるいくつかの事前情報がない限り。ノイズの多い写真の白または黒のピクセルのようです。
KarolisKoncevičius19年

1
@innisfreeそのようなテストがどのように見えるか知りたいのですが、小さな例を考えていただけますか?およびに対応するが網羅的でない限り、を拒否して受け入れることはできないと確信しています。θ=1H0θ{0,1}H0H1
bi_scholar

2

なぜ対立仮説を立てる必要があるのでしょうか。

古典的な仮説検定では、対立仮説が果たす唯一の数学的役割は、選択した検定統計量を通じて証拠の順序付けに影響を与えることです。対立仮説は、テストに適切なテスト統計を決定するために使用されます。これは、帰無仮説を最も助長するもの(前述の代替に対して)から帰着仮説を最も助長しないものへのすべての可能なデータ結果の序数ランキングを設定することと同等です。(上記の代替案に対して)。可能性のあるデータ結果のこの序数ランキングを形成すると、対立仮説は、テストでそれ以上の数学的役割を果たしません


形式的な説明:観測可能なデータ値を使用する従来の仮説検定では、検定統計量があります。データのすべての可能な結果を​​序数スケールにマッピングし、それが帰無仮説または対立仮説のどちらに役立つかを測定します。(一般性を失うことなく、低い値は帰無仮説を助長し、高い値は対立仮説を助長するものと想定します。テスト統計の高い値は、それらがより極端である限り、「より極端」であると言うことがあります。対立仮説の証拠。)次に、検定p値は次のように与えられます。nx=(x1,...,xn)T:RnR

p(x)pT(x)P(T(X)T(x)|H0).

このp値関数は、任意のデータベクトルのテストの証拠を完全に決定します。選択した有意水準と組み合わせると、データベクトルの検定の結果が決まります。(これは固定数のデータポイントについて説明しましたが、これは任意のを許可するように簡単に拡張できます。)p値は、それが誘発する序数スケールを通じてのみ検定統計量の影響を受けることに注意することが重要です。nnなので、テスト統計に単調増加する変換を適用しても、仮説テストに違いはありません(つまり、同じテストです)。この数学的特性は、検定統計量の唯一の目的が、可能なすべてのデータベクトルの空間に順序スケールを導入し、null / alternativeにより適したものを示すことであるという事実を単に反映しています。

対立仮説は、関数を通じてのみこのT測定に影響を与えます。関数、モデル全体で指定された帰無仮説と対立仮説に基づいて選択されます。したがって、検定統計量関数は、モデル全体のおよび2つの仮説の関数であると見なすことができます。たとえば、尤度比検定の場合、検定統計量は、帰無仮説と対立仮説に関連するパラメーター範囲での尤度関数の上限の比(または比の対数)をとることによって形成されます。Tg(M,H0,HA)M


テストを別の選択肢と比較すると、どういう意味ですか?固定モデルあり、同じ帰無仮説を2つの異なる代替およびと比較する2つの異なる仮説検定を実行するとします。この場合、2つの異なるテスト統計関数があります。MH0HAHA

T=g(M,H0,HA)T=g(M,H0,HA),

対応するp値関数につながる:

p(x)=P(T(X)T(x)|H0)p(x)=P(T(X)T(x)|H0).

とが互いの単調増加変換である場合、p値関数とは同一であるため、両方の検定が同じ検定であることに注意することが重要です。関数とが互いに単調増加変換でない場合、2つの真に異なる仮説検定があります。TTppTT


2
このテストは、極端な結果に直面したときに帰無仮説を棄却するように設計されており、対立仮説の役割は、帰無仮説が真である場合に結果が極端であると見なされることを指摘することで、これに同意します
Henry

1

私が対立仮説を受け入れることを考えない理由は、それが私たちがテストしているものではないためです。帰無仮説有意性検定(NHST)は、帰無仮説が真であると仮定して、観測された(またはそれ以上の)極端なデータを観測する確率を計算します。つまり、NHSTは、帰無仮説が真であるという条件付きの確率値を計算します。 、。つまり、帰無仮説が真であると仮定した場合のデータの確率です。仮説の確率を使用したり、与えたりすることは決してありません(nullも代替もありません)。したがって、小さなp値を観測すると、観測したデータが下ではありそうにないように見えることがP(data|H0)H0、それであなたはヌルに対して証拠を集めており、あなたの代わりの説明が何であれ賛成しています。

実験を実行する前に、結果が有意であると見なすカットオフレベル()を決定できます。つまり、p値がそのレベルを下回った場合、nullに対する証拠が圧倒的に高いため、データは他のデータ生成プロセスに由来している必要があり、その証拠に基づいて帰無仮説を拒否します。p値がそのレベルを超えている場合、サンプルが別のデータ生成プロセスで生成されたと考えるほど十分な証拠がないため、帰無仮説を棄却できません。α

対立仮説を立てるのは、サンプリングを始める前に実験を考えていたからです。対立仮説を立てると、片側検定または両側検定のどちらを使用するかを決定できるため、(片側シナリオで)より多くの統計的検出力が得られます。しかし、技術的には、テストを実行するために対立仮説を立てる必要はなく、データが必要です。


NHSTは計算しません。それは計算。区別は重要です。P 観測されたデータと同じくらい極端なデータ| H 0P(data|H0)P(data as extreme as that observed|H0)
innisfree

@innisfree私も同意し、それがまさに同じ文でデータを定義した方法です。
Stefan

?データが定義されている場所がどこにもありません(そのように、または他の方法で)
innisfree

それがあったとしても、それはなぜですか?なぜデータをそのように再定義するのですか?私は.. Pの周りのテキストの部分(データを明確にするためにお勧めする
イニスフリー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.