誰かが仮説検定や回帰分析のためにノンパラメトリック統計手法よりもパラメトリックを選択する理由を説明できますか?
私の考えでは、それはあなたがそれを濡らさないかもしれないので、ラフティングに行き、非防水時計を選ぶようなものです。あらゆる機会に機能するツールを使用してみませんか?
誰かが仮説検定や回帰分析のためにノンパラメトリック統計手法よりもパラメトリックを選択する理由を説明できますか?
私の考えでは、それはあなたがそれを濡らさないかもしれないので、ラフティングに行き、非防水時計を選ぶようなものです。あらゆる機会に機能するツールを使用してみませんか?
回答:
まれに、パラメトリックテストとノンパラメトリックテストが実際に同じヌルを持つことはほとんどありません。パラメトリック検定は、最初の2つのモーメントが存在すると仮定して、分布の平均をテストします。ウィルコクソンのランクサムテストは、モーメントを仮定せず、代わりに分布の等価性をテストします。その暗黙のパラメーターは、分布の奇妙な関数であり、1つのサンプルからの観測値が他のサンプルからの観測値よりも低い確率です。完全に指定された同一の分布のnullの下での2つのテスト間の比較について、ちょっと話をすることもできますが、2つのテストが異なる仮説をテストしていることを認識する必要があります。
パラメトリックテストがその仮定とともにもたらす情報は、テストの能力を向上させるのに役立ちます。もちろん、その情報はより適切ですが、そのような予備情報が存在しない最近の人間の知識の領域はほとんどありません。「私は何も仮定したくない」と明示的に言っている興味深い例外は、ノンパラメトリック法が広く普及し続けている法廷であり、それはアプリケーションにとって完全に理にかなっています。フィリップ・グッドがノンパラメトリック統計と法廷統計の両方について優れた本を執筆したのには、おそらくしゃれが意図した正当な理由があるでしょう。
また、ノンパラメトリックテストに必要なmicrodataにアクセスできないテスト状況もあります。2つのグループを比較して、一方が他方より肥満かどうかを測定するように求められたとします。理想的な世界では、すべての人の身長と体重を測定し、身長で層別する順列テストを作成できます。理想に満たない(つまり、現実の)世界では、各グループの平均身長と平均体重しか得られない場合があります(または、サンプル平均に加えて、これらの特性の範囲または分散がある場合があります)。最善の策は、各グループの平均BMIを計算し、平均値しかない場合はそれらを比較することです。または、平均と分散がある場合は身長と体重の2変量正規と仮定します(サンプルに付属していない場合は、おそらく外部データから相関を取る必要があります)。
他の人が書いたように:前提条件が満たされている場合、パラメトリックテストはノンパラメトリックテストよりも強力になります。
あなたの時計の類推では、非耐水性のものは濡れない限りはるかに正確です。たとえば、耐水性の時計はいずれの場合も1時間ずれている可能性がありますが、非耐水性の時計は正確です...ラフティング旅行後にバスに乗る必要があります。そのような場合、非防水時計を携帯して、濡れないようにするのが理にかなっています。
ボーナスポイント:ノンパラメトリック法は必ずしも簡単ではありません。はい、at testに代わる置換テストは簡単です。しかし、複数の双方向の相互作用と入れ子になったランダム効果を持つ混合線形モデルのノンパラメトリックな代替は、の単純な呼び出しよりもセットアップがかなり困難nlme()
です。私は置換テストを使用してこれを行いましたが、私の経験では、パラメトリックモデルからの残差が非常に非正規であっても、パラメトリックテストと置換テストのp値は常に非常に近くなっています。パラメトリックテストは、多くの場合、前提条件からの逸脱に対して驚くほど回復力があります。
多くの場合、ノンパラメトリック手法が好ましいことに同意しますが、パラメトリック手法がより有用な状況もあります。
「2標本t検定とウィルコクソンの順位和検定」の議論に焦点を当てましょう(そうでなければ、本全体を書かなければなりません)。
仮説検定では、ノンパラメトリック検定がしばしば異なる仮説を検定します。これが、ノンパラメトリック検定を常にパラメトリック検定に置き換えることができない理由の1つです。
より一般的には、パラメトリック手順は、そうでなければ構造化されていない問題に構造を課す方法を提供します。これは非常に便利であり、モデルが文字通り真実であるという信念ではなく、一種の単純化したヒューリスティックと見なすことができます。たとえば、回帰関数を使用して予測子ベクトルに基づいて連続応答を予測する問題を考えます(そのような関数が存在すると仮定しても、一種のパラメトリック制約です)。についてまったく何も仮定しない場合、X 、F 、F 、F (X )= Σ P J = 1 β J X Jこの関数を推定する上でどのように進むかはまったく明確ではありません。検索する必要がある可能性のある答えのセットが大きすぎます。ただし、可能な答えのスペースを(たとえば)線形関数のセットに制限すると、実際に進行を開始できます。モデルが正確に保持されていると信じる必要はありません。不完全な答えにたどり着く必要があるため、単に近似値を作成しています。
セミパラメトリックモデルには多くの利点があります。Wilcoxonテストなどのテストを特別なケースとして提供しますが、効果比、分位、平均、超過確率の推定が可能です。それらは、縦断データと打ち切りデータにまで及びます。これらはY空間でロバストであり、推定手段を除いて変換不変です。詳細な例/ケーススタディについては、http://biostat.mc.vanderbilt.edu/rmsのコース配布資料へのリンクを参照してください。
対照的に、完全にパラメトリック法(へ検定、通常の重回帰、混合効果モデル、パラメトリック生存モデル、等)、セミパラメトリック順序又は連続方法の分布に関する仮定何所与のためのはなく、さらにその分布は単峰性または滑らかです。分布には、その内部または境界に深刻なスパイクがある場合もあります。セミパラメトリックモデルは、2つの異なる共変量設定と分布間の接続(例、Coxモデルの場合のべき乗)のみを想定していますY Y X X 1 X 2。例には、比例オッズモデル(特別な場合:WilcoxonおよびKruskal-Wallis)および比例ハザードモデル(特別な場合:ログランクおよび層別ログランク検定)が含まれます。
実際、セミパラメトリックモデルには多くの切片があります。これらの切片は、の分布をノンパラメトリックにエンコードします。ただし、これにより、オーバーパラメーター化の問題が発生することはありません。
提供された多数の回答の中で、ベイジアン統計にも注意を喚起します。可能性だけでは答えられない問題もあります。頻度論者は反確率的推論を使用します。この場合、「確率」は代替宇宙を指し、代替宇宙フレームワークは犯罪者の罪悪感や無実などの個人の状態を推測する限り意味がありません。大規模な環境変化にさらされた種は絶滅に至りました。ベイズの文脈では、確率は頻度ではなく「信念」であり、すでに沈殿した確率に適用できます。
現在、大多数のベイジアン手法では、事前確率と結果の確率モデルを完全に指定する必要があります。そして、これらの確率モデルのほとんどはパラメトリックです。他の人が言っていることと一致して、これらはデータの意味のある要約を作成するために正確に正確である必要はありません。「すべてのモデルが間違っています。一部のモデルは便利です。」
もちろん、ノンパラメトリックベイジアン法があります。これらには統計上の多くのしわがあり、一般的に言えば、ほぼ包括的な人口データを有意義に使用する必要があります。
上記のすべての素晴らしい回答にもかかわらず、私が答えている唯一の理由は、パラメトリックテストを使用する1番目の理由(少なくとも粒子物理データ解析では)に誰も注意を向けていないことです。データのパラメータ化を知っているからです。ああ!それは大きな利点です。数百、数千、または数百万のデータポイントを、関心のある少数のパラメーターに分解して、分布を記述しています。これらは、基礎となる物理学(または科学がデータを提供するもの)を教えてくれます。
もちろん、基礎となる確率密度がわからない場合は選択肢がありません。ノンパラメトリック検定を使用します。ノンパラメトリックテストには、先入観の偏りがないという長所がありますが、実装が難しい場合があります-時にははるかに難しい場合があります。
ノンパラメトリック統計には独自の問題があります!それらの1つは仮説検定に重点を置いていることです。多くの場合、推定と信頼区間が必要であり、ノンパラメトリックの複雑なモデルでそれらを取得するのは複雑です。このことについて非常に優れたブログ記事がで、議論して、ありhttp://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ 議論は、この他のポストにつながる、のhttp:// notstatschat。 tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-testは、ウィルコクソンに関する非常に異なる視点に推奨されます。短いバージョンは次のとおりです。ウィルコクソン(および他のランクテスト)は非推移性につながる可能性があります。
ノンパラメトリック統計は、パラメトリック統計よりも仮定が少ないという意味で、より一般的に適用可能であると思います。
それでも、パラメトリック統計を使用し、基礎となる仮定が満たされている場合、パラメトリック統計はノンパラメトリックよりも強力になります。
パラメトリック統計は、多くの場合、外部の[データへの]知識を組み込む方法です。たとえば、エラーの分布は正常であり、この知識はデータセットからではなく、以前の経験またはその他の考慮事項から得られたものであることがわかります。この場合、正規分布を仮定することにより、この外部知識をパラメーター推定値に組み込み、推定値を改善する必要があります。
時計の例えで。最近では、宝石や木材などの珍しい素材を使用した特殊な部品を除き、ほとんどすべての時計が耐水性です。それらを着る理由はまさにそれです:彼らは特別です。あなたが防水を意味するなら、多くのドレスウォッチは防水ではありません。それらを着用する理由は、再びその機能です:あなたはスイートとネクタイとダイバーの時計を着用しないでしょう。また、最近では多くの時計が開いており、クリスタルを通してムーブメントを見ることができます。当然、これらの時計は通常防水ではありません。
これは仮説テストのシナリオではありませんが、質問に答える良い例かもしれません。クラスタリング分析を考えてみましょう。階層クラスタリング、K-meansなどの「ノンパラメトリック」クラスタリング手法は数多くありますが、問題は常に、クラスタリングソリューションが他の可能なソリューションよりも「優れている」かどうかを評価する方法です(そして、多くの場合、複数の可能なソリューションがあります) 。各アルゴリズムは最高の品質を提供しますが、それ以上優れているものがないかどうかをどのように知るか..?現在、クラスタリングに対するパラメトリックなアプローチ、いわゆるモデルベースのクラスタリングもあります、有限混合モデルのような。FMMを使用して、データの分布を記述する統計モデルを構築し、データに適合させます。モデルがある場合、このモデルが与えられたデータの可能性を評価し、尤度比テストを使用して、AICを比較し、モデルの適合性とモデル比較をチェックするために他の複数の方法を使用できます。ノンパラメトリッククラスタリングアルゴリズムは、いくつかの類似性基準を使用してデータをグループ化しますが、FMMを使用すると、データを記述して理解し、適合度を確認し、予測を行うことができます。すぐに使用でき、かなり優れていますが、FMMには問題がありますが、それでも、モデルベースのアプローチではより豊富な出力が得られることがよくあります。
新しいデータの予測と予測は、ノンパラメトリックモデルでは非常に困難または不可能なことがよくあります。たとえば、WeibullまたはLognormal生存モデルを使用して今後10年間の保証請求の数を予測できますが、CoxモデルまたはKaplan-Meierを使用してこれを行うことはできません。
編集:もう少しはっきりさせてください。会社に欠陥のある製品がある場合、現在の保証請求と販売データに基づいて、将来の保証請求率とCDFを予測することにしばしば関心があります。これは、リコールが必要かどうかを判断するのに役立ちます。ノンパラメトリックモデルを使用してこれを行う方法がわかりません。
私はこの質問に対する正しい答えはないと信じています。与えられた答えから判断すると、コンセンサスは、パラメトリックテストがノンパラメトリックテストよりも強力であるということです。私はこの見解に異議を唱えませんが、学校で明確に教えられたものではなく、「あなたがノンパラメトリックテストを使用したため論文が却下された」と言うことはないので、事実の視点というよりも仮想的な視点と考えています。この質問は、統計の世界では明確に答えることができないが、当たり前だと思っているものに関するものです。
私の個人的な意見は、パラメトリックまたはノンパラメトリックのどちらを選ぶかは、他の何よりも伝統に関係しているということです(より良い用語がないため)。テストと予測のためのパラメトリックテクニックが最初にあり、長い歴史があるため、それらを完全に無視することは容易ではありません。特に予測には、今日の第一選択ツールとして広く使用されている印象的なノンパラメトリックソリューションがあります。これが、ノンパラメトリックであるニューラルネットワークや決定木などの機械学習技術が近年広く普及した理由の1つだと思います。
これは統計的検出力の問題です。一般に、ノンパラメトリックテストは、対応するパラメトリックテストよりも統計的検出力が低くなります。
すでに多くの良い答えがありますが、言及されていないいくつかの理由があります:
親しみやすさ。視聴者によっては、パラメータの結果は、ほぼ同等のノンパラメトリックの結果よりもはるかに馴染みがあるかもしれません。2つが同様の結論を出す場合、親しみやすさは良好です。
シンプル。場合によっては、パラメトリックテストの実行とレポートが簡単になることがあります。いくつかのノンパラメトリック手法は、非常にコンピューター集約型です。もちろん、コンピューターの処理速度は大幅に向上し、アルゴリズムも改善されましたが、データは「大きく」なりました。