なぜパラメトリック統計がノンパラメトリックよりも優先されるのでしょうか？

60

誰かが仮説検定や回帰分析のためにノンパラメトリック統計手法よりもパラメトリックを選択する理由を説明できますか？

私の考えでは、それはあなたがそれを濡らさないかもしれないので、ラフティングに行き、非防水時計を選ぶようなものです。あらゆる機会に機能するツールを使用してみませんか？

— en1
ソース

21

統計的推論のプロセスに誘導バイアスを導入することです。それは素晴らしい言い方です：何かを知っているなら、それをヒントとして提供してください。このヒントは、尤度の関数形式やパラメータの事前分布を提供するなどの形式をとることがあります。ヒントが良い場合は、ヒントがない場合よりも結果が良くなり、悪い場合は結果が悪化します。

— カグダスオズゲンク

6

必ずしも。基本的に、非常に大きなデザートで何かを探しています。誰かがあなたが探しているものが特定の領域に限定されているとあなたに言うならば、それを見つけるあなたのチャンスは改善します。しかし、彼らが間違った情報であなたを誤解させた場合、その地域をいくら検索しても、それを見つけることはできません。

— カグダスオズゲンク

17

木工家として、私は最後に類推が大好きです。よく建てられた、最後の家や家具は、特殊なツールを使用して構築されます。汎用ツールは、住宅所有者や、仕事を迅速に行う必要がある専門家や、粗雑なツールや不適切なツールを使用しても、誰もが気にするような品質の違いをもたらさない場合に最適です。しかし、職人は仕事に適切なツールを使用することで最高の結果を達成します。実際、いくつかのことはそれなしではできません。例えば、誰もが汎用ハンドソーで良いアリ溝を作ったことはありません。

— whuber

3

踏spaで溝を掘るかティースプーンで掘っても、溝になります。あなたが小さじを使用した場合、それもあなたが年上だということです。

— 共役

5

関連する（おそらくそうではないかもしれないが）：もし平均がそれほど敏感なら、なぜそもそもそれを使うのか？

— GUNG -モニカ元に戻し

25

まれに、パラメトリックテストとノンパラメトリックテストが実際に同じヌルを持つことはほとんどありません。パラメトリック検定は、最初の2つのモーメントが存在すると仮定して、分布の平均をテストします。ウィルコクソンのランクサムテストは、モーメントを仮定せず、代わりに分布の等価性をテストします。その暗黙のパラメーターは、分布の奇妙な関数であり、1つのサンプルからの観測値が他のサンプルからの観測値よりも低い確率です。完全に指定された同一の分布のnullの下での2つのテスト間の比較について、ちょっと話をすることもできますが、2つのテストが異なる仮説をテストしていることを認識する必要があります。 $t$

パラメトリックテストがその仮定とともにもたらす情報は、テストの能力を向上させるのに役立ちます。もちろん、その情報はより適切ですが、そのような予備情報が存在しない最近の人間の知識の領域はほとんどありません。「私は何も仮定したくない」と明示的に言っている興味深い例外は、ノンパラメトリック法が広く普及し続けている法廷であり、それはアプリケーションにとって完全に理にかなっています。フィリップ・グッドがノンパラメトリック統計と法廷統計の両方について優れた本を執筆したのには、おそらくしゃれが意図した正当な理由があるでしょう。

また、ノンパラメトリックテストに必要なmicrodataにアクセスできないテスト状況もあります。2つのグループを比較して、一方が他方より肥満かどうかを測定するように求められたとします。理想的な世界では、すべての人の身長と体重を測定し、身長で層別する順列テストを作成できます。理想に満たない（つまり、現実の）世界では、各グループの平均身長と平均体重しか得られない場合があります（または、サンプル平均に加えて、これらの特性の範囲または分散がある場合があります）。最善の策は、各グループの平均BMIを計算し、平均値しかない場合はそれらを比較することです。または、平均と分散がある場合は身長と体重の2変量正規と仮定します（サンプルに付属していない場合は、おそらく外部データから相関を取る必要があります）。

— StasK
ソース

3

テストの場合、あなたは同じヌルを持っていないことを理解していますが、ヌルが別のヌルよりも優れていると言うのが意味があるかどうかはわかりません。しかし、予測の場合はどうでしょうか？完全に異なるストーリー、まだパラメトリックとノンパラメトリックのジレンマ。

— en1

22

他の人が書いたように：前提条件が満たされている場合、パラメトリックテストはノンパラメトリックテストよりも強力になります。

あなたの時計の類推では、非耐水性のものは濡れない限りはるかに正確です。たとえば、耐水性の時計はいずれの場合も1時間ずれている可能性がありますが、非耐水性の時計は正確です...ラフティング旅行後にバスに乗る必要があります。そのような場合、非防水時計を携帯して、濡れないようにするのが理にかなっています。

ボーナスポイント：ノンパラメトリック法は必ずしも簡単ではありません。はい、at testに代わる置換テストは簡単です。しかし、複数の双方向の相互作用と入れ子になったランダム効果を持つ混合線形モデルのノンパラメトリックな代替は、の単純な呼び出しよりもセットアップがかなり困難nlme()です。私は置換テストを使用してこれを行いましたが、私の経験では、パラメトリックモデルからの残差が非常に非正規であっても、パラメトリックテストと置換テストのp値は常に非常に近くなっています。パラメトリックテストは、多くの場合、前提条件からの逸脱に対して驚くほど回復力があります。

— S.コラッサ-復職モニカ
ソース

前提条件が満たされている場合、パラメトリック手法はより強力であるという一般的な見解のようです。しかし、その場合、両方のアプローチからの結果を評価するためにp値があるのはなぜですか？つまり、パラメトリック検定が少なくとも99％の確率で帰無仮説を棄却する場合、99％の確率で帰無仮説を棄却するノンパラメトリック検定からどのように改善されるのでしょうか。0.99の確率はそれぞれの場合で異なりますか？それは意味がありません。

— en1

1

帰無仮説は、パラメトリック検定とそのノンパラメトリック検定で異なります。具体的には、パラメトリック検定の帰無仮説には、検定統計量の分布に関する特定のパラメトリック仮定が含まれます（これは通常、2つのテストに対して異なる方法で計算されます）。したがって、2つのp値は同じ名前ですが、異なる検定仮説に基づいて計算され、異なる検定仮説は異なる帰無仮説の下で異なる分布を持ちます。

— S. Kolassa -モニカ元に戻し

...そして@StasKは、私がやったよりもずっとよくそれを表現しました。

— S. Kolassa-モニカの復職

3

@StephanKolassa、私は実際にあなたの答えにコメントを書き始め、夢中になった:)

— StasK

12

多くの場合、ノンパラメトリック手法が好ましいことに同意しますが、パラメトリック手法がより有用な状況もあります。

「2標本t検定とウィルコクソンの順位和検定」の議論に焦点を当てましょう（そうでなければ、本全体を書かなければなりません）。

2〜3の小さなグループサイズでは、t検定のみが理論的に5％未満のp値を達成できます。生物学と化学では、このようなグループサイズは珍しくありません。もちろん、このような設定でt検定を使用するのは微妙です。しかし、多分それは何もないよりはましです。（この点は、完全な状況では、t検定がウィルコクソン検定よりも強力であるという問題に関連しています）。
巨大なグループサイズでは、中央限界定理のおかげで、t検定もノンパラメトリックであると見なすことができます。
t検定の結果は、平均差のスチューデント信頼区間と一致しています。
グループ間で分散が大きく異なる場合、Welchバージョンのt検定はこれを考慮に入れようとしますが、ウィルコクソンのランクサムテストは、平均を比較しようとすると失敗する可能性があります）。

— マイケル・M
ソース

2

特に、プロシージャが有効であると期待する理由がない場合は、決定を下すことができるため、プロシージャを使用するだけでは十分な理由にはなりません。データがほとんどまたはまったくない場合は、判断を下すだけで、厳密に基づいているふりをしないでください。

— dsaxton

5

仰るとおりです。最高ランクの雑誌に掲載されたとしても、結果がしばしば再現できないことが多いのは明らかに1つの理由です。しかし、予算がごく小さなサンプルサイズしか許可しない場合、研究者としてどのような選択肢がありますか？

— マイケルM

1

Re 4と、グループ間に不均等な分散がある場合のWilcoxon-Mann-Whitneyの適用に関する問題には、不均一分散性を可能にするノンパラメトリックな方法があります。たとえば、クリフの検定やブルナー-マンツェルの検定を思い出すようです。（このサイトでそれらに関する多くの情報を持っているとは思わない。）

— Silverfish

@Silverfish：私はよくBrunnerの方法を使用していますが、あなたは正しいと思います。しかし、強力な分布の仮定を行う場合、それらが実際に比較手段を除いていることを疑います。

— マイケルM

1

@MichaelMはい、もちろん-それは、異なる仮説を持つパラメトリック法とノンパラメトリック法の問題に戻ってくると思います。

— シルバーフィッシュ

9

仮説検定では、ノンパラメトリック検定がしばしば異なる仮説を検定します。これが、ノンパラメトリック検定を常にパラメトリック検定に置き換えることができない理由の1つです。

より一般的には、パラメトリック手順は、そうでなければ構造化されていない問題に構造を課す方法を提供します。これは非常に便利であり、モデルが文字通り真実であるという信念ではなく、一種の単純化したヒューリスティックと見なすことができます。たとえば、回帰関数を使用して予測子ベクトルに基づいて連続応答を予測する問題を考えます（そのような関数が存在すると仮定しても、一種のパラメトリック制約です）。についてまったく何も仮定しない場合 $y$ $x$ $f$ $f$ この関数を推定する上でどのように進むかはまったく明確ではありません。検索する必要がある可能性のある答えのセットが大きすぎます。ただし、可能な答えのスペースを（たとえば）線形関数のセットに制限すると、実際に進行を開始できます。モデルが正確に保持されていると信じる必要はありません。不完全な答えにたどり着く必要があるため、単に近似値を作成しています。 $f(x) = \sum_{j=1}^{p} \beta_j x_j$

— ダクストン
ソース

はい、それはモデルバイアスを追加します。それは、研究者が報告するp値について何を伝えていますか？

— カグダスオズゲンク

@dsaxtonの言うことは、さまざまな仮説をテストすることには当てはまりますが、人々はまだ同じように解釈しています。次に、回帰もあります。ここで、ノンパラメトリック分析とパラメトリック分析の間で得られる洞察はほとんど同じです。

— en1

@ cagdas-ozgencこれは、p値がモデルを条件としていることを示しています。しかし、物事が他の方法でどうなるかは明確ではありません

— 共役

3

+1は、回帰関数に関するいくつかの仮定なしに、回帰で価値のあるものを推定する可能性がまったくないことに注意してください。

— 共役前

9

セミパラメトリックモデルには多くの利点があります。Wilcoxonテストなどのテストを特別なケースとして提供しますが、効果比、分位、平均、超過確率の推定が可能です。それらは、縦断データと打ち切りデータにまで及びます。これらはY空間でロバストであり、推定手段を除いて変換不変です。詳細な例/ケーススタディについては、http：//biostat.mc.vanderbilt.edu/rmsのコース配布資料へのリンクを参照してください。

対照的に、完全にパラメトリック法（へ検定、通常の重回帰、混合効果モデル、パラメトリック生存モデル、等）、セミパラメトリック順序又は連続方法の分布に関する仮定何所与のためのはなく、さらにその分布は単峰性または滑らかです。分布には、その内部または境界に深刻なスパイクがある場合もあります。セミパラメトリックモデルは、2つの異なる共変量設定と分布間の接続（例、Coxモデルの場合のべき乗）のみを想定しています $t$ $Y$ $Y$ $X$ $X_{1}$ $X_{2}$ 。例には、比例オッズモデル（特別な場合：WilcoxonおよびKruskal-Wallis）および比例ハザードモデル（特別な場合：ログランクおよび層別ログランク検定）が含まれます。

実際、セミパラメトリックモデルには多くの切片があります。これらの切片は、の分布をノンパラメトリックにエンコードします。ただし、これにより、オーバーパラメーター化の問題が発生することはありません。 $Y$

— フランク・ハレル
ソース

1

私はこれに少し苦労しています。t検定はセミパラメトリックまたはノンパラメトリックとみなされますか？一方では、私は常にセミパラメトリックの「ジスト」を次のように仮定しています：データの「実用的な」確率モデルを取り、分布が正しいかどうかに関係なくその分布のパラメーターを推定し、不確実性を考慮してください。（したがって、ガウススコア方程式の解のサンドイッチベースのエラーは、セミパラメトリックT検定になります）。ただし、コパラメトリックモデルの場合と同様に、セミパラメトリックではほとんどの場合、何かをパーシャル化/コンディショニングします。

— AdamO

それに対処するために、回答にさらに説明を追加します。

— フランクハレル

6

提供された多数の回答の中で、ベイジアン統計にも注意を喚起します。可能性だけでは答えられない問題もあります。頻度論者は反確率的推論を使用します。この場合、「確率」は代替宇宙を指し、代替宇宙フレームワークは犯罪者の罪悪感や無実などの個人の状態を推測する限り意味がありません。大規模な環境変化にさらされた種は絶滅に至りました。ベイズの文脈では、確率は頻度ではなく「信念」であり、すでに沈殿した確率に適用できます。

現在、大多数のベイジアン手法では、事前確率と結果の確率モデルを完全に指定する必要があります。そして、これらの確率モデルのほとんどはパラメトリックです。他の人が言っていることと一致して、これらはデータの意味のある要約を作成するために正確に正確である必要はありません。「すべてのモデルが間違っています。一部のモデルは便利です。」

もちろん、ノンパラメトリックベイジアン法があります。これらには統計上の多くのしわがあり、一般的に言えば、ほぼ包括的な人口データを有意義に使用する必要があります。

— AdamO
ソース

6

上記のすべての素晴らしい回答にもかかわらず、私が答えている唯一の理由は、パラメトリックテストを使用する1番目の理由（少なくとも粒子物理データ解析では）に誰も注意を向けていないことです。データのパラメータ化を知っているからです。ああ！それは大きな利点です。数百、数千、または数百万のデータポイントを、関心のある少数のパラメーターに分解して、分布を記述しています。これらは、基礎となる物理学（または科学がデータを提供するもの）を教えてくれます。

もちろん、基礎となる確率密度がわからない場合は選択肢がありません。ノンパラメトリック検定を使用します。ノンパラメトリックテストには、先入観の偏りがないという長所がありますが、実装が難しい場合があります-時にははるかに難しい場合があります。

— TimeVariant
ソース

5

ノンパラメトリック統計には独自の問題があります！それらの1つは仮説検定に重点を置いていることです。多くの場合、推定と信頼区間が必要であり、ノンパラメトリックの複雑なモデルでそれらを取得するのは複雑です。このことについて非常に優れたブログ記事がで、議論して、ありhttp://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ 議論は、この他のポストにつながる、のhttp：// notstatschat。 tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-testは、ウィルコクソンに関する非常に異なる視点に推奨されます。短いバージョンは次のとおりです。ウィルコクソン（および他のランクテスト）は非推移性につながる可能性があります。

— kjetil b halvorsen
ソース

4

推移性がすべてであり、すべてであるかどうかはわかりません。また、ウィルコクソン検定を逆にすると、非常に堅牢で有用な位置推定器の信頼区間を取得できます。

— フランクハレル

2

非推移性には因果モデリングにポイントがありますが、単純な2つの関連性のサンプルテストについては、実際には問題ではないと思います。また、ノンパラメトリック法とパラメトリック法の間で仮説検定/推定/信頼区間の違いを見ることもできません。時には、ロバスト推定では、作業確率モデルを使用して、対応するパラメトリック推定がデータの意味のある要約を提供するようにします（それ自体が正しい確率モデルでなくても）。おそらくあなたはこの答えを拡張できますか？

— AdamO

2

通常、ウィルコクソン検定では、あるグループが他のグループよりも確率的に支配的である場合、真の場合に推移性が回復するなど、いくつかの追加の仮定が行われます。

— Scortchi -モニカ元に戻し

3

ノンパラメトリック統計は、パラメトリック統計よりも仮定が少ないという意味で、より一般的に適用可能であると思います。

それでも、パラメトリック統計を使用し、基礎となる仮定が満たされている場合、パラメトリック統計はノンパラメトリックよりも強力になります。

2

パラメトリック統計は、多くの場合、外部の[データへの]知識を組み込む方法です。たとえば、エラーの分布は正常であり、この知識はデータセットからではなく、以前の経験またはその他の考慮事項から得られたものであることがわかります。この場合、正規分布を仮定することにより、この外部知識をパラメーター推定値に組み込み、推定値を改善する必要があります。

時計の例えで。最近では、宝石や木材などの珍しい素材を使用した特殊な部品を除き、ほとんどすべての時計が耐水性です。それらを着る理由はまさにそれです：彼らは特別です。あなたが防水を意味するなら、多くのドレスウォッチは防水ではありません。それらを着用する理由は、再びその機能です：あなたはスイートとネクタイとダイバーの時計を着用しないでしょう。また、最近では多くの時計が開いており、クリスタルを通してムーブメントを見ることができます。当然、これらの時計は通常防水ではありません。

— アクサカル
ソース

1

私はこの比likeが好きです！ある教授が、同じ結果を得ることができるかどうかを確認するために、同じものに対して異なる統計手法を試すべきだと言ったことを覚えています。

— ディープノース

2

これは仮説テストのシナリオではありませんが、質問に答える良い例かもしれません。クラスタリング分析を考えてみましょう。階層クラスタリング、K-meansなどの「ノンパラメトリック」クラスタリング手法は数多くありますが、問題は常に、クラスタリングソリューションが他の可能なソリューションよりも「優れている」かどうかを評価する方法です（そして、多くの場合、複数の可能なソリューションがあります）。各アルゴリズムは最高の品質を提供しますが、それ以上優れているものがないかどうかをどのように知るか..？現在、クラスタリングに対するパラメトリックなアプローチ、いわゆるモデルベースのクラスタリングもあります、有限混合モデルのような。FMMを使用して、データの分布を記述する統計モデルを構築し、データに適合させます。モデルがある場合、このモデルが与えられたデータの可能性を評価し、尤度比テストを使用して、AICを比較し、モデルの適合性とモデル比較をチェックするために他の複数の方法を使用できます。ノンパラメトリッククラスタリングアルゴリズムは、いくつかの類似性基準を使用してデータをグループ化しますが、FMMを使用すると、データを記述して理解し、適合度を確認し、予測を行うことができます。すぐに使用でき、かなり優れていますが、FMMには問題がありますが、それでも、モデルベースのアプローチではより豊富な出力が得られることがよくあります。

— ティム
ソース

2

新しいデータの予測と予測は、ノンパラメトリックモデルでは非常に困難または不可能なことがよくあります。たとえば、WeibullまたはLognormal生存モデルを使用して今後10年間の保証請求の数を予測できますが、CoxモデルまたはKaplan-Meierを使用してこれを行うことはできません。

編集：もう少しはっきりさせてください。会社に欠陥のある製品がある場合、現在の保証請求と販売データに基づいて、将来の保証請求率とCDFを予測することにしばしば関心があります。これは、リコールが必要かどうかを判断するのに役立ちます。ノンパラメトリックモデルを使用してこれを行う方法がわかりません。

— グレン
ソース

7

失礼ですが同意できません。Coxモデルを使用して、変位値、平均（最高のY値が無修正の場合）、およびあらゆる種類の確率を推定できます。ただし、データの範囲を超えて予測できないことは問題ですが（前述のとおり）、危険な外挿を行う可能性があります。

— フランクハレル

@FrankHarrellはい、良い点です。外挿するときは常に注意が必要です。

— グレン

ランダムフォレスト、ディープラーニング、またはSVMはどうですか？すべてではないにしても、予測のためのほとんどのパラメトリック手法に勝っています。

— en1

2

決定木に斜めの境界を学習させることを除いて

— -bill_e

1

私はこの質問に対する正しい答えはないと信じています。与えられた答えから判断すると、コンセンサスは、パラメトリックテストがノンパラメトリックテストよりも強力であるということです。私はこの見解に異議を唱えませんが、学校で明確に教えられたものではなく、「あなたがノンパラメトリックテストを使用したため論文が却下された」と言うことはないので、事実の視点というよりも仮想的な視点と考えています。この質問は、統計の世界では明確に答えることができないが、当たり前だと思っているものに関するものです。

私の個人的な意見は、パラメトリックまたはノンパラメトリックのどちらを選ぶかは、他の何よりも伝統に関係しているということです（より良い用語がないため）。テストと予測のためのパラメトリックテクニックが最初にあり、長い歴史があるため、それらを完全に無視することは容易ではありません。特に予測には、今日の第一選択ツールとして広く使用されている印象的なノンパラメトリックソリューションがあります。これが、ノンパラメトリックであるニューラルネットワークや決定木などの機械学習技術が近年広く普及した理由の1つだと思います。

— デジオ
ソース

3

3 / π \approx 95 %

$3/\pi \approx 95\%$

「コンセンサス」とは、個人的な見解ではなく、「一般的な合意」を意味します。

— ディジオ

2

私はちょうど文があることを指摘し、文はあなた自身の個人的な見解や他の集団の知恵を表現するかどうかに言及されなかったパラメトリックテストのために必要な条件が成立した場合にのみ正しいです。条件が満たされない場合、「パラメトリックテストはノンパラメトリックよりも強力」であるとは言えない可能性があり、実際には逆の場合もあります（非常に広いマージンで）。

— シルバーフィッシュ

Touché！..... +1

— Digio

0

これは統計的検出力の問題です。一般に、ノンパラメトリックテストは、対応するパラメトリックテストよりも統計的検出力が低くなります。

— 隠れマルコフモデル
ソース

6

前提条件が満たされている場合、パラメトリックテストはより強力になります。それらの仮定が満たされない場合、ノンパラメトリックテストはより強力になる可能性があります。

— GUNG -モニカ元に戻し

3

この答えは非常に短く、力については以前の答えで説明しました。少し拡大することを検討しますか？

— Scortchi-モニカの復職

4

パラメトリックテストからの電力利得は、仮定が満たされていない場合に被る電力損失と比較するとごくわずかです。

— フランクハレル

フランク、それはテストに依存します、いくつかのテストはそれらの仮定の違反に対してより堅牢です。

— 隠れマルコフモデル

0

すでに多くの良い答えがありますが、言及されていないいくつかの理由があります：

親しみやすさ。視聴者によっては、パラメータの結果は、ほぼ同等のノンパラメトリックの結果よりもはるかに馴染みがあるかもしれません。2つが同様の結論を出す場合、親しみやすさは良好です。
シンプル。場合によっては、パラメトリックテストの実行とレポートが簡単になることがあります。いくつかのノンパラメトリック手法は、非常にコンピューター集約型です。もちろん、コンピューターの処理速度は大幅に向上し、アルゴリズムも改善されましたが、データは「大きく」なりました。
1. パラメトリックテストの通常は不利な点は、実際には利点ですが、これは特定のテストペアに固有のものです。例えば、私は一般に、通常の方法よりも仮定が少ない分位数回帰のファンです。ただし、中央値ではなく平均値を推定する必要がある場合があります。

— ピーター・フロム-モニカの復職
ソース