帰無仮説ではなく、サンプリングを介して生成された信頼区間で帰無仮説を棄却できますか?


9

母集団からサンプリングした後、信頼区間の形式でパラメーター推定値を生成できることを教えられました。たとえば、95%の信頼区間には、違反のない仮定があり、母集団内で推定している真のパラメーターが何であれ、95%の成功率が含まれているはずです。

つまり、

  1. サンプルからポイント推定を作成します。
  2. 理論的には推定しようとしている真の値が95%の確率で含まれる値の範囲を生成します。

ただし、トピックが仮説テストに移ったとき、手順は次のように説明されました。

  1. 一部のパラメーターを帰無仮説と仮定します。
  2. この帰無仮説が真であるとすると、さまざまな点推定値が得られる可能性の確率分布を生成します。
  3. 帰無仮説が真の場合に得られる点推定が5%未満の時間で生成される場合は、帰無仮説を拒否します。

私の質問はこれです:

帰無仮説を棄却するために、帰無仮説を使用して信頼区間を生成する必要がありますか?最初の手順を実行し、真のパラメーターの推定値を取得して(信頼区間の計算で仮定値を明示的に使用せずに)、帰無仮説がこの区間に入らない場合は棄却しませんか?

これは直感的には論理的には同等に思えますが、このように教えられる理由があると考えられるため、非常に根本的な何かを見逃しているのではないかと心配しています。


Martijn、不明確であることに私の謝罪。近いうちに投稿を編集して、将来同じ質問を探している人がわかりやすいようにします。つまり、サンプルからパラメーター推定値を計算したり、帰無仮説を使用して帰無仮説サポートすると見なす推定の範囲を計算したりできます。パラメータ推定値を使用してnullがパラメータ推定値の範囲内にあるかどうかを確認するのではなく、ポイント推定値がこの間隔にあるかどうかを確認するためにnullを使用する必要がある理由がわかりませんでした。私はそれが理にかなっていると思います!
Nikli

興味深い思考実験は、誰かがあなたの重み付きサイコロを売ろうとした場合です。彼らはそれらを転がし、あなたが観察する方向に重み付けされていることを述べます(例えば、6は時間の20%まで上がる)。それらは(どれだけのサンプルスローが行われたか)重み付けされていますか、また、独自の(追加の)ダイススローテストを実行する価値はありますか?売り手と買い手は異なる目標を持っています...
フィリップオークリー

回答:


5

σ2=1Y¯μN(0,1/n)zα/2Φ(zα/2)=α/2Φ(zα/2)=1α/2

1α=Pr{(X¯μ)/(1/n)(zα/2,zα/2)}=Pr{zα/2(X¯μ)nzα/2}=Pr{zα/2(μX¯)nzα/2}=Pr{zα/2/nμX¯zα/2/n}=Pr{X¯zα/2/nμX¯+zα/2/n}=Pr{(X¯zα/2/n,X¯+zα/2/n)μ}
(X¯zα/2/n,X¯+zα/2/n)
1α

同時に、表示の最初の行のイベントは、このに対して帰無仮説が棄却されないイベントでもあります。残りは同等の再定式化を含んでいるだけなので、ciは実際にはnullが拒否されないすべてのを含み、「nullの下」への参照は必要ありません。μμ

これは、信頼区間と検定の間の双対性として知られているものを示すことを目的とした、Martijnの+1視覚化に類似したプロットです。一部に属する間隔信頼意味及びいくつかの仮説に属する受入れ領域。Cx¯A(μ0)μ=μ0

ここに画像の説明を入力してください


10

はい、サンプルから計算された信頼区間との比較により、仮説検定(サンプルをテスト結果の仮想分布と比較)を置き換えることができます。しかし、間接的に、信頼区間はすでに一種の仮説検定です。つまり、

  • 信頼区間は、レベルの仮説検定が成功αし、範囲外のレベルの仮説検定が失敗する値の範囲として構築されていると考えられるかもしれません。α

そのような範囲を作ることの結果は、範囲が時間のほんの一部のに失敗するということです。α

以下の質問に対する回答の画像を使用しています:信頼区間:を正式に処理する方法P(L(X)θ,U(X)θ)=1α

Clopper-Pearsonのグラフのバリエーションです。成功の確率があり、成功の総数を観察する100のベルヌーイ試行のケースを想像してください。θX

基準確率

ご了承ください:

  • 垂直方向には、仮説検定が表示されます。たとえば、与えられた仮説値に対して、測定されたが赤または緑の点線の上または下にある場合、仮説を棄却します。θX

  • 水平方向には、Clopper-Pearson信頼区間が表示されます。与えられた観測Xに対してこれらの信頼区間を使用すると、時間の5%だけが誤りになります。

    (このようなXのみを観察するため、時間の5%が「間違った」間隔に基づいているため)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.