推定の信頼区間を正式に導出している間、値の計算方法に非常によく似た式になりました。
したがって、質問:それらは形式的に同等ですか?すなわち仮説拒否され臨界値とと同等臨界値と信頼区間に属さない?
推定の信頼区間を正式に導出している間、値の計算方法に非常によく似た式になりました。
したがって、質問:それらは形式的に同等ですか?すなわち仮説拒否され臨界値とと同等臨界値と信頼区間に属さない?
回答:
はいといいえ。
観察したことは、検定と信頼区間が同じ統計に基づいている場合、それらの間に等価性があることです値は、パラメーターのnull値がとるαの最小値として解釈できます。1 - α信頼区間に含まれます。
してみましょうパラメータ空間内の未知のパラメータであるΘ ⊆ R、およびサンプル聞かせてX = (X 1、... 、xはn個)∈ X N ⊆ R n個の確率変数の実現可能X = (X 1、... 、X n)。簡単にするために、信頼区間を定義Iのα(Xを)などの、ランダム間隔としてカバレッジ確率P θ (同様に、より一般的な間隔を考慮することができます。この場合、カバレッジ確率は 1 - αに制限されるか、ほぼ等しくなります。推論は類似しています。)
両側検定を考えるポイント帰無仮説代替に対するH 1(θ 0):θ ≠ θ 0。ましょうλ (θ 0、X)試験のp値を示します。いずれかのためにα ∈ (0 、1 )、H 0(θ 0)レベルで拒否されたα場合。レベル α拒絶領域はの集合である Xの拒否につながる H 0(θ 0): R α(θ 0)=を{ X ∈ R N:λ (θ 0、X)≤ α } 。
さて、p値と両側検定の家族を考えるのために、θ ∈ Θ。そのような家族のために、我々は定義することができる逆阻止領域Qのαを(X)= { θ ∈ Θ :λ (θ 、X)≤ α } 。
任意の固定のための、H 0(θ 0)拒否された場合のx ∈ R α(θ 0)、発生している場合に限りθ 0 ∈ Q α(X)、である、 X ∈ R α(θ 0)⇔ θ 0 ∈ Q α(X)。 テストが完全に指定された絶対連続ヌル分布のテスト統計に基づいている場合、
この現象は、ネストされていないこのような間隔に関連する問題に関係しています。つまり、94%の間隔は95%の間隔よりも短くなる可能性があります。詳細については、この最近の私の論文のセクション2.5を参照してください(ベルヌーイに掲載されます)。
一部の問題では、標準信頼区間は標準検定と同じ統計に基づいていません(Michael Fayがこのペーパーで説明したように)。これらの場合、信頼区間とテストでは同じ結果が得られない場合があります。例えば、信頼区間に0が含まれていても、テストによって拒否される場合があります。異なる統計が使用されるため、これは上記の「はい」と矛盾しません。
コメントのf coppensによって指摘されているように、間隔とテストの目標が相反することがあります。短い間隔と高出力のテストが必要ですが、最短間隔が常に最大出力のテストに対応するとは限りません。このいくつかの例については、この論文(多変量正規分布)、またはこれ(指数分布)、または私の論文のセクション4を参照してください。
数年前、ベイジアン統計にもテスト間隔等価性が存在するかどうかについて質問を投稿しました。簡単な答えは、標準的なベイジアン仮説検定を使用すると、答えは「いいえ」であるということです。ただし、テストの問題を少し修正することで、答えは「はい」になります。(自分の質問に答えようとする私の試みは、最終的に論文になりました!)
単一のパラメーターを見るとき、パラメーターの値と信頼区間「不一致」についてのテストは、それらがどのように構成されているかによって異なります。特に、仮説検定はレベルです-帰無仮説をある割合で棄却する場合 帰無仮説が真である時間の そのため、たとえば、帰無仮説の下でのみ有効なモデルパラメーターの推定値(分散など)を使用できます。このテストを反転してCIを構築しようとした場合、対立仮説ではカバレッジが正しくない可能性があります。そのため、通常、カバレッジが代替のすぐ下にもあるように、通常は信頼区間を異なる方法で構築します。これにより、(通常は非常に小さい)不一致が発生する可能性があります。