テストを行うと、2つの結果が生じます。
1)帰無仮説を棄却
2)帰無仮説を棄却できません。
対立仮説の受け入れについては触れません。対立仮説の受け入れについて話さない場合、なぜ対立仮説を立てる必要があるのでしょうか。
ここに更新があります: 誰かが私に2つの例を与えることができます:
1)帰無仮説を拒否することは、対立仮説を受け入れることと同じです
2)帰無仮説を拒否することは、対立仮説を受け入れることとは異なります
テストを行うと、2つの結果が生じます。
1)帰無仮説を棄却
2)帰無仮説を棄却できません。
対立仮説の受け入れについては触れません。対立仮説の受け入れについて話さない場合、なぜ対立仮説を立てる必要があるのでしょうか。
ここに更新があります: 誰かが私に2つの例を与えることができます:
1)帰無仮説を拒否することは、対立仮説を受け入れることと同じです
2)帰無仮説を拒否することは、対立仮説を受け入れることとは異なります
回答:
「対立仮説の受け入れについて話さない場合、なぜ対立仮説を立てる必要があるのでしょうか?」に焦点を当てます。
これは、意味のあるテスト統計を選択し、調査が高出力になるように設計するのに役立つためです。選択肢がなければ、私たちは権力の概念を持っていません。
帰無仮説のみがあり、代替案がないとします。その場合、強力な検定統計量を選択する方法に関するガイダンスはありません。私たちが言えることは、「値がnullを下回る可能性が低いテスト統計を観察するときは常にnullを拒否すること」です。任意のものを選択できます。Uniform(0,1)の乱数を描画し、0.05未満の場合はnullを拒否できます。これはnullが「まれに」発生する確率は5%未満ですが、nullがfalseの場合もまれです。したがって、これは技術的には統計的検定ですが、何かに対するまたはそれに対する証拠としては無意味です。
その代わり、通常、我々はいくつかの科学的妥当な代替仮説を持っている(「存在である私の実験で治療群と対照群の間での成果に正の差が」)。悪魔の提唱者として帰無仮説を提起する可能性のある批評家に対して、それを擁護したいと思います(「私はまだ確信していません---おそらく、あなたの治療は実際に傷ついているか、まったく効果がなく、データはサンプリング変動のみによるものです」)。
これらの2つの仮説を念頭に置いて、代替の下での典型的な値がnullの下ではありそうもない検定統計量を選択することにより、強力な検定をセットアップできます。(0から遠い正の2サンプルt統計は、代替がtrueの場合は驚くべきではありませんが、nullがtrueの場合は驚くべきです。)次に、nullの下での検定統計量のサンプリング分布を把握し、p値を計算できるようにします。 ---そしてそれらを解釈します。nullの可能性が低いテスト統計を観察する場合、特に、研究デザイン、サンプルサイズなどが高い検出力を持つように選択されている場合、これは代替案のいくつかの証拠を提供します。
それでは、対立仮説を「受け入れる」ことについて話しませんか?強力な研究でさえ、ヌルが間違っているという完全に厳密な証拠を提供しないからです。それはまだ一種の証拠ですが、他のいくつかの種類の証拠よりも弱いです。
歴史的に、対立仮説が必要かどうかについては意見の相違がありました。この不一致の点について、頻度論的統計とベイジアンの回答という文脈の中で、フィッシャーとネイマンの意見を検討することで説明しましょう。
フィッシャー -対立仮説は必要ありません。適合度テストを使用して、帰無仮説を簡単にテストできます。結果は値であり、帰無仮説の証拠の尺度を提供します。
ネイマン-nullと代替案の間で仮説検定を実行する必要があります。テストは、固定された事前に指定されたレートでタイプ1エラーが発生するようなテストです。結果は、レベルで帰無仮説を棄却するか否かを決定することです。
決定理論の観点からの代替案が必要です。2つのアクションコースから選択します。テストの力を報告する必要があるためです
代替案が真の場合に
を拒否する可能性が最も高い、最も強力なテストを探す必要があります。
これらの両方の点を満たすために、仮説は漠然とした 'not ' 仮説にはなりません。
ベイジアン -少なくとも2つのモデルを検討し、それらの相対的妥当性をデータで更新する必要があります。モデルが1つだけの場合、
収集するデータに関係なく、ます。このフレームワークで計算を行うために、仮説(またはこのコンテキストで知られているモデル)は、不適切に定義された「not」のものではありません。モデル書き込めないため、私はそれを不適切な定義と呼び。
イムは、これが正式な要件ではなく、一般的であることを確認した場合、100%ではないよヌル仮説と代替網羅1)補完および2):仮説です。つまり、1)両方を同時に真にすることはできません。2)一方が真でない場合、もう一方も真でなければなりません。
女の子と男の子の間の身長の簡単なテストを検討してください。この場合の典型的な帰無仮説は、です。別の仮説は、です。つまり、nullが真でない場合、alternativeは真でなければなりません。
なぜ対立仮説を立てる必要があるのでしょうか。
古典的な仮説検定では、対立仮説が果たす唯一の数学的役割は、選択した検定統計量を通じて証拠の順序付けに影響を与えることです。対立仮説は、テストに適切なテスト統計を決定するために使用されます。これは、帰無仮説を最も助長するもの(前述の代替に対して)から帰着仮説を最も助長しないものへのすべての可能なデータ結果の序数ランキングを設定することと同等です。(上記の代替案に対して)。可能性のあるデータ結果のこの序数ランキングを形成すると、対立仮説は、テストでそれ以上の数学的役割を果たしません。
形式的な説明:観測可能なデータ値を使用する従来の仮説検定では、検定統計量があります。データのすべての可能な結果を序数スケールにマッピングし、それが帰無仮説または対立仮説のどちらに役立つかを測定します。(一般性を失うことなく、低い値は帰無仮説を助長し、高い値は対立仮説を助長するものと想定します。テスト統計の高い値は、それらがより極端である限り、「より極端」であると言うことがあります。対立仮説の証拠。)次に、検定のp値は次のように与えられます。
このp値関数は、任意のデータベクトルのテストの証拠を完全に決定します。選択した有意水準と組み合わせると、データベクトルの検定の結果が決まります。(これは固定数のデータポイントについて説明しましたが、これは任意のを許可するように簡単に拡張できます。)p値は、それが誘発する序数スケールを通じてのみ検定統計量の影響を受けることに注意することが重要です。なので、テスト統計に単調増加する変換を適用しても、仮説テストに違いはありません(つまり、同じテストです)。この数学的特性は、検定統計量の唯一の目的が、可能なすべてのデータベクトルの空間に順序スケールを導入し、null / alternativeにより適したものを示すことであるという事実を単に反映しています。
対立仮説は、関数を通じてのみこの測定に影響を与えます。関数、モデル全体で指定された帰無仮説と対立仮説に基づいて選択されます。したがって、検定統計量関数は、モデル全体のおよび2つの仮説の関数であると見なすことができます。たとえば、尤度比検定の場合、検定統計量は、帰無仮説と対立仮説に関連するパラメーター範囲での尤度関数の上限の比(または比の対数)をとることによって形成されます。
テストを別の選択肢と比較すると、どういう意味ですか?固定モデルあり、同じ帰無仮説を2つの異なる代替およびと比較する2つの異なる仮説検定を実行するとします。この場合、2つの異なるテスト統計関数があります。
対応するp値関数につながる:
とが互いの単調増加変換である場合、p値関数とは同一であるため、両方の検定が同じ検定であることに注意することが重要です。関数とが互いに単調増加変換でない場合、2つの真に異なる仮説検定があります。
私が対立仮説を受け入れることを考えない理由は、それが私たちがテストしているものではないためです。帰無仮説有意性検定(NHST)は、帰無仮説が真であると仮定して、観測された(またはそれ以上の)極端なデータを観測する確率を計算します。つまり、NHSTは、帰無仮説が真であるという条件付きの確率値を計算します。 、。つまり、帰無仮説が真であると仮定した場合のデータの確率です。仮説の確率を使用したり、与えたりすることは決してありません(nullも代替もありません)。したがって、小さなp値を観測すると、観測したデータが下ではありそうにないように見えることが、それであなたはヌルに対して証拠を集めており、あなたの代わりの説明が何であれ賛成しています。
実験を実行する前に、結果が有意であると見なすカットオフレベル()を決定できます。つまり、p値がそのレベルを下回った場合、nullに対する証拠が圧倒的に高いため、データは他のデータ生成プロセスに由来している必要があり、その証拠に基づいて帰無仮説を拒否します。p値がそのレベルを超えている場合、サンプルが別のデータ生成プロセスで生成されたと考えるほど十分な証拠がないため、帰無仮説を棄却できません。
対立仮説を立てるのは、サンプリングを始める前に実験を考えていたからです。対立仮説を立てると、片側検定または両側検定のどちらを使用するかを決定できるため、(片側シナリオで)より多くの統計的検出力が得られます。しかし、技術的には、テストを実行するために対立仮説を立てる必要はなく、データが必要です。