電力が非常に低い「難解な」統計テストはありますか?


11

バックグラウンド

コンピュータサイエンス、数学、およびその他の分野では、「難解な」例は面白いだけでなく、特定の概念を説明するのに役立ちます。たとえば、

  • BogosortSlowsortは、特に他のソートアルゴリズムと比較すると、アルゴリズムのプロパティを理解するために使用できる非常に非効率的なソートアルゴリズムです。

  • 難解なプログラミング言語は、プログラミング言語の概念がどれほど広範囲に及ぶかを示し、優れたプログラミング言語を評価するのに役立ちます。

  • ワイエルシュトラス関数ディリクレ機能は、主に継続性の概念についての特定の誤解を説明するために使用を見出します。

私は現在、仮説検定の使用に関するいくつかの指導を準備しており、非常に低い検出力(ただし他の欠陥はない)での検定が統計的検出力の概念を説明するのに役立つと思います。(もちろん、私は、与えられた例が私の聴衆にとって教訓的に有用であるのか、それとも混乱するだけなのかを自分自身で決定する必要があります。)

実際の質問

意図的に低電力の統計テストはありますか?

  • テストは仮説テストの一般的なフレームワークに適合します。つまり、このテストは帰無仮説で機能し、要件があり、(正しい)p  値を返します。
  • 深刻なアプリケーションを対象としたものではありません。
  • それは非常に低い電力を持っています(意図的な設計上の欠陥によるもので、サンプルや効果のサイズが低いためではありません)。

そのようなテストは存在できないと根本的に主張できるのであれば、これも私の質問に対する有効な回答だと思います。一方、そのようなテストが多数存在する場合は、最も教育的に効率的なテストに興味があります。つまり、簡単にアクセスでき、目立つ効果があるはずです。

私はことに注意してください統計ミスの一般的な選択を求めない(チェリー・ピッキングなど)、または類似。

これまでに見つけたもの

インターネット検索で何も返されませんでした。

このようなものを構築するすべての試みは、いくつかの(有用な)既存のテストで終了するか、形式が通常のテストの形式ではありません。たとえば、母集団の正の中央値がすべてのサンプルが正の場合にのみ「はい」を返すかどうかのテストについて考えました。しかし、そのテストはp  値を返さないため、通常のテストフレームワークには適合しません。正と負の符号を検定統計量として数えるだけで( それに応じてp値を計算する)、合理的な検定である符号検定で終了します。


2
より数学的な、「難解な」例(多くあります)は、一般的な誤解に対する具体的な反例になる傾向があります。多くの教科書にはそのような例が含まれています。現状では、あなたの質問は本質的に「大きなリスト」タイプの質問であり、そのため広すぎます(ただし、複数のユーザーが質問が不明確であると結論付けていることに注意してください)。質問を明確にしてその範囲を狭めることができれば、サイトにより適している可能性があります。
Glen_b

1
何と比べて低電力?レーマンは、帰無仮説よりも対立仮説のもとではパワーが低い一般化された尤度比検定の例を示しました。
Scortchi-モニカの回復

2
Rao-Blackwellizationを適用する愚かな推定量のいずれも検定統計量として使用できます。たとえば、サンプルの最初の観測値があり、平均の推定量として使用されます。Rao-Blackwellizedすると、標本平均が得られます。私はクラスでこのような多くの練習をしなければなりませんでした。とにかく、この統計は検定のようなものでサンプル平均の代わりに使用できます。しかし、いいえ、あなたが探している形で直接考えることはできません。または、コメントではなく回答を書きます。しかし、テスト構築の一般的な方法の失敗を示す何かがあるはずです。t
user54038

1
コンピューターのところにいるときは、レーマンの論文を掘り下げます。ヌルでのテストの威力は、テストのサイズにすぎません。
Scortchi-モニカの回復

3
私が(何年も前に)学生だったクラスで使用されたテスト例は、「パワー20のサイコロを振って、1を振れば拒否する」でした(パワーカーブの説明の一部として)。もちろん、これはデータを完全に無視しますが、目的のタイプIエラー率(例が与えられたコンテキストでは5%)よりも高くないという点で「有効な」テストです。
Glen_b

回答:


7

Neyman–Pearson補題への少し注目された帰結があります(ガイサー(2006)の証明、パラメトリック統計推論のモード、Ch 4.4): は、帰無仮説密度とデータからの密度、最も強力なレベル-テスト定義します。

Eϕ(X)=α
ϕ(x)={0 when f0(x)<kf1(x)1 when f0(x)>kf1(x)
αϕH0:f0H1:f1x

この結果から、均一に最も弱い、局所的に最も弱い、均一に最も弱い類似、および最も強力でない「完全にバイアスされた」テストを導出できます(つまり、nullでの代替よりも低いパワーのテスト)。あなたがすでに均一で最も強力なものを持っているなら、&c。テスト、単にテスト統計に-1を掛けて、パーティションの順序を逆にしながら、それが引き起こすサンプル空間のパーティションを維持します。


おそらく、@ user54038が示唆しているように、「テスト構築の一般的な方法の失敗」の方が興味深いかもしれません。Lehmann(1950)、「統計的仮説をテストする理論のいくつかの原則」、アン。数学。統計学者。21、1、スタインに次の例を属性。

ましょ値をとることができるランダム変数で示すように、確率と:X0,±1,±2

22110Hypothesis H:α2α212α12ααAlternatives:pC(1p)C1C1α(12α)1C1α(12α)α1c1α
ここで、、は定数、、およびは範囲の範囲です。αC0<α12α2α<C<αp[0,1]

仮説を有意水準で 検定することが望まれます。場合、尤度比検定は拒否されます。そのため、その各検出力に対する検出力はです。以来、、このテストは、電源とテストのために、無駄より文字通り悪い観察することなく得ることができる単純に乱数テーブルを用いることにより、全く。HαX=±2CC<ααX

これは、彼が検討している一般化された尤度検定であり、を最大化する迷惑パラメータの役割にすることに注意してください。したがって、または場合、それぞれまたはあり、どちらの場合も尤度比はになります。他の値の場合、これはの低い方の値です。pX=2X=2p^=1p^=02CαX1C1α


5

(@Scortchiによるコメントに関連)

仮定、我々は仮説をテストしたいですXN(μ,1)

H0:μ=0H1:μ0

エステリアシズムのために、独立した「コインフリップ」使用してデータを拡張します。 ここで、は既知であり、有意水準(つまり)以上です。次の形式の拒否領域を検討してください。ZBernoulli(p)pαp[α,1]

R={(X,Z) | z=1 |x|>Φ1(α2p)}

構造上、これは有効なテストです。α

P(XR | μ=0)=P(Z=1 , |X|>Φ1(α2p))=P(Z=1)P(|X|>Φ1(α2p))=pαp=α

ただし、この検定の能力は超えることはありません。たとえば、観測データがます。帰無仮説棄却されるべきであることは明らかですが、私たちのコインは「尾を見せている」ので、帰無を棄却できません。設定すると、拒絶領域がにまったく依存しないが、サイズ有効な拒絶領域であるという、さらにおかしな例につながります。p(x,z)=(1000000,0)p=αXα

同様の質問は、拒絶地域の交差点を労働組合に変更することにより、宿題として与えることができます。この領域は、がない領域よりも一様に強力ではありませんが、パワーに上限がないという意味でより合理的です。Z


2
(+1)1次元の補助統計量があるため、密接に関連していますとすると、。ここで、はの分布関数です。SZ=1(S<FS1(p))FS()S
Scortchi-モニカの回復
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.