堅牢な統計テストとそうでない統計テストがあります。堅牢性とはどういう意味ですか?驚いたことに、私はこのサイトでそのような質問を見つけることができませんでした。
さらに、テストの堅牢性と強力性が一緒に議論されることもあります。直感的には、2つの概念を区別できませんでした。強力なテストとは何ですか?堅牢な統計的検定とはどう違いますか?
堅牢な統計テストとそうでない統計テストがあります。堅牢性とはどういう意味ですか?驚いたことに、私はこのサイトでそのような質問を見つけることができませんでした。
さらに、テストの堅牢性と強力性が一緒に議論されることもあります。直感的には、2つの概念を区別できませんでした。強力なテストとは何ですか?堅牢な統計的検定とはどう違いますか?
回答:
堅牢性には統計上さまざまな意味がありますが、使用されるデータの種類の変化に対する回復力がある程度あります。これは少し曖昧に聞こえるかもしれませんが、それは堅牢性が変更に対するさまざまな種類の無感覚を参照できるためです。例えば:
テストの場合、堅牢性とは通常、そのような変更が与えられた場合でもテストがまだ有効であることを指します。つまり、結果が有意であるかどうかは、テストの仮定が満たされている場合にのみ意味があります。そのような仮定が緩和されている(つまり、それほど重要ではない)場合、テストは堅牢であると言われます。
テストの力は、真の違いがある場合に有意な違いを検出する能力です。特定のテストとモデルがさまざまな仮定で使用される理由は、これらの仮定が問題を単純化するためです(たとえば、推定するパラメーターが少なくて済む)。テストが有効になるには、これらのすべての前提条件を満たしている必要があるため、テストの前提条件が多いほど堅牢性は低くなります。
一方、仮定が少ないテストはより堅牢です。ただし、入力からの情報が少なく使用されるか、より多くのパラメーターを推定する必要があるため、一般に堅牢性には電力がかかります。
堅牢な
A 、それが正規分布グループを前提としながら、それはまだ比較するための有効なテストであるため、検定は、堅牢であると言うことができ、ほぼ正規分布グループを。
Wilcoxon検定は、の仮定が満たされた場合はそれほど強力ではありませんが、基礎となる分布を仮定せず、したがって非正規データに対して有効であるため、より堅牢です。通常、元の数値ではなくデータのランクを使用し、本質的に一部の情報を破棄するため、そのパワーは低くなります。
堅牢ではありません
アン検定分散の比較であるが、それは非正規に非常に敏感であり、したがって、おおよそ正常には無効。言い換えれば、Fテストはロバストではありません。
powerful
あなたの答えで説明したとおりであるかどうかをさらに尋ねました。強力なテストとはどういう意味ですか?
「ロバストな統計的検定」の正式な定義はありませんが、これが何を意味するかについて、ある種の一般的な合意があります。ウィキペディアのWebサイトでは、これを適切に定義しています(テスト自体ではなく、統計の観点から)。
堅牢な統計とは、広範囲の確率分布から抽出されたデータ、特に正規分布ではない分布のパフォーマンスが良好な統計です。