統計的仮説検定の著者はどのようにして彼らの統計を思いついたのですか?
状況に応じて、テスト統計を識別する方法は多数あります。いくつかのもっともらしい仮定の下で、ピックアップすることが重要だと思われる代替案を特定し、それらに対して何らかの力を得ようとすることが重要です。
たとえば、母平均に関連する仮説がある場合(実際、それを単純にして、1標本検定を考えてみましょう)、標本平均に基づく統計は、ヌルと代替では異なる動作をします。ただし(たとえば)、ラプラス/二重指数関数ファミリーのシフト代替法を見ている場合(DExp(μ,τ))、サンプルの中央値に基づくものは、サンプルの平均に基づくものよりも、平均のシフトの検定に適しています。
特定の分布族に基づく特定のパラメトリックモデルがある場合、大規模なサンプルには魅力的なプロパティが多数あるため、少なくとも尤度比検定を検討するのが一般的です。
最初からテストを設計しようとしている多くの状況では、テスト統計は極めて重要な量に基づいています。1サンプルのt検定(およびこれまでに見た他の多くの検定)の検定統計量は、極めて重要な量です。
特定の問題を考えると、理想的な(これが客観的な根拠で定義できる場合)統計がどうあるべきかは常に明白ですか?
どういたしまして。たとえば、代替のミニバスに対する一般的な正規性の検定を考えてみましょう。正規性からの逸脱を測定するには多くの方法があり(そのようなテストの数十が提案されています)、一般的なサンプルサイズでは、どの方法もすべての選択肢に対して最も強力ではありません。
そのような状況のテストを設計しようとするとき、特定の創造性が、あなたが最も興味を持っている種類の代替案に対して優れた力を持つ選択肢を思い付くために要求されます。
上記のステップ2で挙げた2つの要件は広すぎるようで、同じ仮説をテストするために多くの異なる統計を考案することができます。
確かに。あなたには、いくつかのパラメトリック仮定を(データはいくつかの分布族から引き出されていると仮定して、あなたの仮説はそれの1つの以上のパラメータに関係します)を作る場合は、そこにあります(具体的には、一様に最も強力なすべてのこのような状況のための最高の可能性テストにテスト)、しかしそれでもあなたのパラメトリック仮定が大まかな推測のようなものである場合でも、その仮定に対するいくつかのロバスト性への欲求は物事をかなり変えるかもしれません。
たとえば(ここでも、ロケーションシフトの1つのサンプルテストを簡単にするために)、通常の母集団からサンプリングしている場合は、t検定が最適です。しかし、私はそれが正確に正常ではないかもしれないと思います、そしてそれに加えて、適度に重いテールの他のプロセスによる少量の汚染があり、次により堅牢なものがあるかもしれません(おそらく、署名のようなランクベースの代替ランクテスト)は、このようなさまざまな状況でパフォーマンスが向上する傾向があります。