パラメトリックおよびノンパラメトリックな統計的検定はありますか?


20

パラメトリックおよびノンパラメトリックな統計的検定はありますか?この質問はインタビューパネルによって尋ねられました。有効な質問ですか?


1
ノンパラメトリック統計のウィキペディアエントリを調べるだけで、インタビュアーの準備が整います。「ノンパラメトリックとはどういう意味ですか?分布のないモデルまたはランク順の統計量」のように、質問に答えることができます。
jrhorn424

3
出発点として、それはあなたとあなたの回答者が定義に関して当局(インターネットではない!)に相談するのを助けるかもしれません。「パラメトリックなケース ...は、すべての[自然の状態]のクラスを、有限数の実コンポーネントからなるベクトル形で自然な方法で表現できるものです。(...分布そして、損失関数は依存合理的な方法を滑らかで)他のすべての問題が呼ばれています。ノンパラメトリック --JCキーファー、。統計的推論、入門 P 23.。θθθ
whuber

教授の一人は、「カイ二乗検定」には両方の挙動がある(つまり、パラメトリックおよびノンパラメトリックでもある)と言った。「カイ二乗検定」に両方の振る舞いがある理由はまったくわかりませんでした。
Biostat

3
パラメトリックなのはテストではなく、モデルです。カイ二乗分布は、両方の状況で発生します(正規分布の仮定を使用した一般的な線形モデルでは自然な方法で、対数尤度の差の近似として(両方ともパラメトリックアプリケーションとして)、また多項分布の近似としても)多くのノンパラメトリックアプリケーションで発生する分布)、「カイ2乗」という名前を共有するさまざまなテストがあります。これはおそらくあなたの教授のコメントを示唆したものです。
whuber

@whuber:最後のコメントは、適合度のカイ二乗検定がノンパラメトリックであることを意味していますか?
ティム

回答:


6

「パラメトリックテスト」と「ノンパラメトリックテスト」が何を意味するかを正確に伝えることは基本的に困難ですが、テストがパラメトリックかノンパラメトリックか(ただし両方ではない) 。簡単な検索でこのが得られました。これは、パラメトリックテストとノンパラメトリックテストのいくつかの分野で一般的な実用的な区別を表していると思います。

参照されているテーブルのすぐ上に、コメントがあります。

「...パラメトリックデータには、基礎となる正規分布があります....それ以外はノンパラメトリックです。」

一部の分野では、正規性を仮定してANOVAを使用し、これがパラメトリックであるか、正規性を仮定せず、ノンパラメトリックの代替を使用することが、一部の領域で受け入れられている基準である場合があります。

それはおそらく非常に良い定義ではなく、私の意見では本当に正しくありませんが、実用的な経験則かもしれません。社会科学における最終目標は、たとえば、データを分析することで、何が良い非正規分布に基づくパラメトリックモデルを策定して、できるようにすることです主な理由ではないデータを分析することができますか?

別の定義は、「ノンパラメトリックテスト」を、分布仮定やパラメトリックテストに依存しないテストとして定義することです。

前者と後者の定義では、テストの1つのクラスを定義してから、他のクラスを補数(その他)として定義しています。定義により、これはテストがパラメトリックでもノンパラメトリックでもあり得ることを排除します。

真実は、後者の定義にも問題があるということです。対称性など、強制できる特定の自然な「ノンパラメトリック」仮定がある場合はどうなりますか?そうでなければ、分布の仮定に依存しない検定統計量をパラメトリック検定に変換できますか?ほとんどはノーと言うでしょう!

したがって、いくつかの分布の仮定を行うことが許可されているノンパラメトリック検定のクラスのテストがあります限り、彼らは「あまりにもパラメトリック」ではないからです。「パラメトリック」テストと「ノンパラメトリック」テストの境界線はあいまいになりましたが、ほとんどの場合、テストがパラメトリックであるかノンパラメトリックであるかを支持すると考えています。ほとんど意味がありません。

別の観点から見ると、多くのパラメトリックテストは(同等の)尤度比テストです。これにより、一般的な理論が可能になり、適切な規則性条件下での尤度比検定の分布特性を統一的に理解できます。ノンパラメトリック検定は、逆に、尤度比検定と等価ではありませんそれ自体が そこには可能性はありません私たちは、ケースバイケースで派生分布の結果を持っている可能性に基づいて統一的な方法論なし。経験的尤度の理論p主にスタンフォードのアート・オーウェンによって開発されたものは、非常に興味深い妥協案です。典型的なパラメトリックな分布の仮定を必要とせずに、尤度ベースの統計アプローチ(私にとって重要なポイントです。尤度は値よりも重要なオブジェクトだと考えています)。基本的な考え方は、経験的データでの多項分布の巧妙な使用です。メソッドは非常に「パラメトリック」でありながら、パラメトリックな仮定を制限することなく有効です。p

経験的尤度に基づくテストには、IMHO、パラメトリックテストの長所、およびノンパラメトリックテストの一般性があります。したがって、私が考えることができるテストの中で、パラメトリックテストおよびノンパラメトリックテストに最も適格になります。この用語は使用しないでください。


+1非常に興味深いコメント。境界線が「ぼやけ」ている限り、それを知覚についての正しい声明と見なしますが、定義自体に不明瞭さはありません。パラメトリックとノンパラメトリックの区別は、例えば有限のそして無限。
whuber

@whuber、「ぼやけた」ことに関して、私は特にノンパラメトリックテストにも分布の仮定がある可能性があるという事実に言及していました。したがって、私の2番目の定義も機能しません。シャープな定義を試みる必要がある場合、パラメトリックテストは、有限次元ユークリッド空間のサブセットによってパラメーター化できるモデルに基づいています。私が最も「ぼんやり」していると思うのは、非パラメトリックな仮定がパラメトリックな仮定と同じくらい問題になる前に、「分布の仮定なし」からどれだけ遠くまで行けるかがはっきりしないということです。
NRH

@whuber、キーファーに関する質問へのコメントを読みました。はい、正式な定義については当局に相談することをお勧めします。私は実際、人々が「ノンパラメトリック」と言うときの一般的な意味に関心があり、キーファー定義を心に抱いている人はほとんどいないと思います。
NRH

元の質問へのコメントでキーファーからの私の引用を参照してください。特に、「ノンパラメトリック」は「分布の仮定がない」という意味ではありません。それどころか、最もよく知られているノンパラメトリックテストはすべて分布の仮定を行います。私はあなたの「ぼやけた」感覚を理解していると思います。実際には非常に多くの(しかし有限の)パラメータが無限とみなされる可能性があるため、その点から有限/無限のアナロジーを選択しました。
whuber

2

:パラメトリックは、(少なくとも)二つの意味で使用されているAあなたはそれのパラメータへのノイズ分布までの家族を想定している宣言するには- 。B-説明変数と結果の間の特定の機能的関係を仮定していることを宣言するため。

いくつかの例:

  • 線形リンクの変位値回帰は、BパラメトリックおよびAノンパラメトリックとして認定されます。
  • ガウスノイズを含む時系列のスプライン平滑化は、AノンパラメトリックおよびBパラメトリックとして品質が向上します。

「セミパラメトリック」という用語は通常、ケースBを指し、機能的な関係全体を想定しているのではなく、「予測子のスムーズな変換における加法性」などの穏やかな仮定を持っていることを意味します。

また、分布の形状を具体的に指定せずに、「すべてのモーメントが有限である」など、ノイズの分布をより穏やかに仮定することもできます。私の知る限り、この種の仮定を表す用語はありません。

答えは、データ生成プロセスの背後にある基本的な前提に関連していることに注意してください。「a-parametric test」と言うとき、通常、ある意味でノンパラメトリックを指します。これがあなたの意味である場合、私は「no」と答えます。同じ意味でパラメトリックとノンパラメトリックを同時に行うことは不可能です。


最初の段落の2つの意味は、文献でしばしば統一された扱いになっています。つまり、それらの間に基本的または重要な区別はないようです。ところで、「すべてのモーメントが有限である」場合は間違いなくノンパラメトリック問題です。
whuber

@whuber:Keiferの定義は両方のケースをカバーしているようです(私は認めません-私はそれを読んだことがなく、私はまだ例外を探しています)。一方、用語はその意味を変えます。「経験的ベイ」は、1955年にロビンスが使用したものを意味しなくなりました。複数の解釈が循環しているという事実を無視することはできません。
ジョンロス

わかりましたが、少し選択する必要があります。明らかに、「パラメトリック」と「ノンパラメトリック」の多くの解釈と試みられた定義は、理解ではなく無知の表現です。すぐに明確で、厳格で、権威ある(正確には、信頼できる査読付きジャーナルによって疑いなく受け入れられるという意味で権威ある)代替定義を引用できますか?
whuber

1
@whuber:チャレンジを受け入れます!:-)ただし、すべての研究者がウィキペディアで検索を開始するため、信頼できる査読付きジャーナルがウィキの定義と一致するのは時間の問題です。(「あなたはそれらを打つことができない場合...」)
ジョンロス

1
Wikipediaの記事は「ノンパラメトリック」を使用する最初のものであるだけでなく、キーファーの直接の知的祖先の一つであるだけでなく、1940年代から、ウォルフォウィッツを引用しています。私たちはそこに本当の違いを見つけるとは思わない。(キーファーは損失関数についての技術的要件のみを追加します。)しかし、特に数学的な基礎のある分野ではなく、ウィキペディアを出発点とする本物の研究者はほとんどいないと思います。
whuber

1

それは「パラメトリックおよびノンパラメトリック」の意味に依存すると思いますか?同時に正確に両方、または2つのブレンド?

Cox比例ハザードモデルは、ベースラインハザードをパラメトリックに推定しないため、セミパラメトリックであると多くの人が考えています。

または、多くのノンパラメトリック統計を実際に大規模なパラメトリックとして表示することを選択できます。


7
これは回避のようです。問題は、「パラメトリック」と「ノンパラメトリック」の区別を理解しているかどうか、それが明確であるかどうかを調べることです。良い答えは、その区別を混乱させることなく照らします。
whuber

1
@whuberどの「質問」ですか?パネル、またはOP?私の考えでは、OPは何かの区別を調査していないからです。それは、人々が線を引く場所に依存することを意味します。「まあ、それは依存します」の一般的かつ哲学的な例を提供することは避けられないと思います。答えだと思います。「パラメトリック」を完全にパラメトリックであると見なしたいかどうか、または単にパラメータを持っているかどうかなど。
フォマイト

「どの質問」がいいのかという点。私があなたの返事でいくつかの問題を抱え始めるのは、それが私のリソースによると意味をなさない区別を作ることだと思います私とは異なる「パラメトリック」と「ノンパラメトリック」の定義を使用しています。答えはこれらの用語の意味に依存しなければならないという優れた点を挙げていますが、実際に後続のコメントを明確または理解可能にするための定義を提供していません。
whuber

@whuberまあまあ。私は元の質問がやや無意味であることがわかったので、できることをしていました。この質問には、OPが何を意味するかについていくつかの仮定を立てるより良い答えがあります。
フォマイト

0

Bradleyは、彼の古典的なDistribution-Free Statistics Tests(1968、p。15–16- 引用についてはこの質問を参照)で、彼は、しばしば相互に混同されていると言う、Distribution-freenonparametric test の違いを明確にし、中央値の符号検定としてのパラメトリック無分布検定の例。それがあるので、このテストは、変量値のサンプリングされた人口の基本的な分布についての仮定を行いません分布フリー。ただし、選択された中央値が正しい場合、それより上および下の値は等しい確率で選択されp=0.5

更新

(A¬A)


1
私はこの答えの始まりが好きです。なぜなら、それは興味深い区別をし、良い参照でそれをサポートしているからです。ただし、回答の残りの部分では、データに関する仮定と検定統計量のプロパティが混同されているように思えます。符号テストの前提は、実際には「配布なし」です。ただし、検定統計量のサンプリング分布が二項分布であるという事実は完全に別の問題であり、手順をパラメトリックにしません!
whuber

さて、Bradley自身は、15ページで、Signalテストを配布なしでありながらパラメトリックと呼んでいます。コメントボックスは小さすぎて、2つの重要な文を完全にまとめることはできません。他の回答、特に「大まかに言って…」と「完全に明確にするために...」で始まる文を読んでください。ありがとうございました。
アヴラハム14年

ブラッドリーの場合は、それ以降、これらの用語の意味が変更されているか、彼が書いたものを誤って解釈することになります。(確認できるコピーにアクセスできません。)「パラメトリック」が検定統計量の分布を指しているのは、少なくとも過去30年間はそうではありません。ウィキペディアの記事の Wolfowitzの引用を参照してください
whuber

2
FΩθ

2
価値があるものについては、他の2つの統計テキスト、DeGrootの確率と統計(第2版、pp 520-521)とLarsonの確率理論と統計的推論紹介(第3版、pp.508-509)を見て、両方ともBraedlyが配布なしと呼ぶものを意味するパラメトリックという用語は、キーファーのようなものであると考えています。したがって、OPに答えるには、「パラメトリック」をどのように定義するかに依存します。
アヴラハム14年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.