テストするかどうかの背後にある理論


7

仮定 Xii.i.d.N(μ,σ2)、 どこ σ2知られている。このデータを使用して、μQ、つまり、平均かどうか μ 有理数です。

ノイズが多すぎるため、これを実行できないことは直感的に明らかです。どのようなテストでもタイプIIのエラー率になると思いますβ=0 タイプIのエラー率 α=1またはその逆。しかし、私はこの仮説検定問題について理論的な説明をする方法を理解していません。この問題は、テストが「難しい」場合を示すより一般的なフレームワークにどのように当てはまりますか?

回答:


7

あなたの直感は正しいです:合計スペースに関して密な平均のnullセットがある場合、連続データでnullセットと代替セットを区別することはできません。これは、対立仮説の平均値の場合、常にnullセットで「任意に近い」値を取得できるためです。したがって、対立仮説の証拠はありません。

この結果の正式なデモンストレーションを取得するには、これを複合仮説検定として構築する動作を実行する必要があります。これは少し注意が必要です。なぜなら、いくつかの検定統計量について議論をしなければならず、ここにはいくつかのもっともらしい異議があるからです。


古典的な仮説検定の正式な構成:この検定の仮説は次のとおりです。

H0:μQ,HA:μQ.

最初に遭遇する問題は、テスト統計の作成です。この問題の尤度比(LR)統計は、有理数が実数で密であるため、常に1です。我々は持っています:

supμQsupσ>0i=1nN(xi|μ,σ2)=(n2πxi2)n/2exp(n2)=supμQsupσ>0i=1nN(xi|μ,σ2),

これらの上限の比率が1になるようにします。これは、標準LR統計が仮説の証拠の尺度として機能しないため、カスタムテスト統計が必要であることを意味します。

ここで、これらの仮説の場合、証拠の序数ランキングは2つのカテゴリにのみ分類されます。標本平均が非合理的(確率1で発生)である場合、これは対立仮説のより大きな証拠です。したがって、検定に適した検定統計量は次のとおりです。TT(X1,...,Xn)I(X¯Q)、この(指標)テスト統計の値が高いほど、代替案の証拠が大きくなります。

以来 X¯N(μ,σ2/n) 継続的であり、 P(T=0|μ,σ)=P(X¯Q|μ,σ)=0すべてのパラメーター値について(これは、有理数がルベーグメジャーゼロを持っているという事実から派生しています)。つまり、パラメーター値に関係なく、検定統計量は同じ分布になります。

観察すると x¯Q (つまり、サンプルの平均は不合理です)、検定のp値は次のとおりです。

pP(T(X¯)t(x¯)|H0)=P(T1|μQ)=1.

観察すると x¯Q (つまり、サンプルの平均は有理です)、検定のp値は次のとおりです。

pP(T(X¯)t(x¯)|H0)=P(T0|μQ)=1.

したがって、仮説を区別しようとするカスタム検定統計を使用しても、nullに対する証拠は得られません。これは直観的に合理的です。対立仮説の平均値については、ヌルセットで常に「任意に近い」値を取得できるためです。


2
もちろん、ここではすべてが正しい(+1)ですが、有理数と実数のトポロジー、およびそれらのルベーグ測度に焦点を当てることをお勧めします。できる限り)。たとえば、モデルがパラメータ付きの正規分布のセットである場合(μ,σ2(μ)) どこ σ(μ)=1 ために μQ そして σ(μ)=2そうでなければ、あなたテストすることができますH0:μQ.「密」のより基本的な意味は、対数尤度比によって決定されるモデルのトポロジにあります。
whuber

2
良い点-私自身の議論は問題になっている特定のケースに限定されただけですが、これをより広いケースのより広い議論に拡張することは確かに興味深いでしょう。
ベン-モニカ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.