パラメトリックおよびノンパラメトリックテストの解釈


8

パラメトリックテストと非パラメトリックテストの違いに関する質問を検索しましたが、質問はすべて非常に特定のテスト、データの問題、またはいくつかの技術的な違いに焦点が当てられているようです。テストの仮定の問題(代わりに調べないでください)や、電力やエラー率の問題には興味がありません。

私の質問は、2種類のテストの解釈についてです。パラメトリックと非パラメトリックのテスト結果の解釈に違いはありますか?ノンパラメトリックテストを実行している場合は、不明な母集団の議論への道を弱めている(排除している)ため、おそらくテスト結果を議論する方法がより制限されているようです。パラメトリックテストを実行する場合、母集団への接続は仮定に基づいて行われます。各テストの適切な解釈は何ですか?これらの区別は重要ですか?

回答:


6

これは、統計モデルが何を意味し、どのように考えるべきかを話し合い、明確にする良い機会です。定義から始めて、この答えの範囲が間違いなくあるようにし、そこから先に進みましょう。この投稿を短くするために、例を制限し、すべてのイラストを省略して、読者が経験からそれらを提供できるようにします。

定義

非常に一般的な意味での「テスト」は、あらゆる種類の統計的手順を意味するものとして理解することができます。帰無仮説テストだけでなく、フリークエンティストフレームワークまたはベイジアンフレームワークのいずれかでの推定、予測、意思決定も含まれます。これは、「パラメトリック」と「ノンパラメトリック」の違いが、手順のタイプの違いやこれらのフレームワークの違いとは異なるためです。

いずれにせよ、プロシージャを統計的にするのは、特性が完全にはわかっていない確率分布で世界をモデル化することです。非常に抽象的なことに、データは、オブジェクトの値数値的にコード化することによって発生すると考えます。私たちが使用している特定のデータは、特定の対応しています。そして、どういうわけか私たちが実際に持っているを決定した確率法則があります。ω Ω ω F ωXωΩωFω

この確率法則は、あるセットに属していると想定されます。でパラメトリック設定、要素数の有限集合に対応、パラメータ。ノンパラメトリックの設定、そのような対応は存在しません。これは通常、について強い仮定を立てたくないためです。F Θのθ F FΘFΘθ(F)F

モデルの性質

めったに議論されないさらなる区別をすることは有用であると思われます。 状況によっては、はデータの完全に正確なモデルになるはずです。「完全に正確」という意味を定義するのではなく、例を挙げましょう。観測値がバイナリであり、欠落がないものであり、測定エラーの可能性がない、有限で明確な母集団の調査を行います。たとえば、組立ラインから出てくるオブジェクトのランダムなサンプルの破壊テストなどです。この状況に対して私たちが持っている制御-母集団を知っており、サンプルを真にランダムに選択できる-は、結果のカウントの二項モデルの正確さを保証します。F

多くの場合、おそらくほとんどの場合、他のケースでは、は「完全に正確」ではありません。たとえば、多くの分析では(暗黙的または明示的に)が正規分布であると想定しています。実際の測定はその可能な範囲に対する物理的な制約を受けるため、これは常に物理的に不可能ですが、正規分布にはそのような制約はありません。私たちは最初に、通常の仮定が間違っていることを知っています!FΘF

完全に正確でないモデルはどの程度問題になりますか?良い物理学者が何をしているのかを考えてください。物理学者が問題を解決するためにニュートン力学を使用するとき、それは彼女がこの特定のスケール(これらの質量、これらの距離、これらの速度)でニュートン力学が機能するのに十分に正確であることを知っているためです。彼女は、問題がそれを必要とする場合にのみ、量子効果または相対論的効果(またはその両方)を考慮することにより、分析を複雑にすることを選択します。彼女は、ニュートン力学が量子力学と特殊相対性理論の限定的なケースであることを定量的に示す定理に精通しています。これらの定理は、どの理論を選択するかを彼女が理解するのに役立ちます。この選択は通常、文書化されておらず、保護さえされていません。無意識のうちに発生することさえあります。選択は明白です。

優れた統計学者は常に比較可能な考慮事項を念頭に置いています。たとえば、正当化が正規性の仮定に依存する手順を選択するとき、実際のが通常の動作からどの程度逸脱するか、およびそれが手順にどのように影響するかを検討します。多くの場合、可能性のある影響は非常に小さいため、定量化する必要すらありません。彼女は「正規性を仮定」しています。他の場合では、起こり得る影響は不明です。そのような状況では、彼女は診断テストを実行して、正常性からの逸脱とその結果への影響を評価します。F

結果

完全に正確ではない設定はノンパラメトリックモデルとほとんど区別されないように聞こえ始めます。パラメトリックモデルを想定することと、現実がそれからどのように逸脱するかを評価することと、ノンパラメトリックモデルを想定することの間に実際の違いはありますか一方? 深いところにありますが、どちらもノンパラメトリックです。

この議論に照らして、パラメトリック手順とノンパラメトリック手順の間の従来の違いを再検討してみましょう。

  • FΘ

  • FΘXF0F1F0F1F0F

  • 「ノンパラメトリックプロシージャは仮定を行いません。」彼らがそうしているのを見てきました。彼らはパラメトリック手順よりも制約の少ない仮定をする傾向があるだけです。

パラメトリックvsノンパラメトリックに過度に焦点を合わせると、逆効果的なアプローチになる可能性があります。理解を改善し、適切な決定を下し、または適切な行動を取る ことである統計的手順の主な目的を見落とします。 統計的手順は、問題に関する他のすべての情報と仮定に照らして、問題のコンテキストでどれだけうまく機能することが期待できるかに基づいて、結果のすべての利害関係者への影響に関して選択されます。

したがって、「これらの区別が重要である」という答えは、「実際にはそうではない」ように見えます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.