ノンパラメトリック統計でなぜ同順位が難しいのですか?


14

私のノンパラメトリックテキストPractical Nonparametric Statisticsでは、期待値、分散、検定統計量などについて明確な式が示されることがよくありますが、これは関係を無視した場合にのみ機能するという警告が含まれています。Mann-Whitney U統計を計算するときは、どちらが大きいかを比較するときに、タイペアを捨てることをお勧めします。

どちらのグループも他のグループよりも大きいため、関係はどの人口が大きいかについてはあまり教えてくれません(それが私たちが興味を持っているのであれば)。しかし、漸近分布を開発する場合、それは問題ではないようです。

なぜそれはいくつかのノンパラメトリック手順での関係を扱うのにそんなに困惑しているのですか?単にそれらを捨てるのではなく、タイから有用な情報を抽出する方法はありますか?

編集:@whuberのコメントに関して、ソースを再度確認しました。一部の手順では、関連付けられた値を完全に削除するのではなく、ランクの平均を使用しています。これは、情報の保持に関しては賢明なことのように思えますが、厳密さを欠いているようにも思えます。しかし、疑問の精神は今でも残っています。


実用的ノンパラメトリック統計は、データが結び付けられたときにデータを「捨てる」ように指示していると言っていますか?そのアドバイスを誤って解釈している可能性がありますか?正確に引用してもらえますか?
whuber

はい、アドバイスを誤って解釈している可能性があります。同じ著者から:jstor.org/stable/2284536 "Wilcoxonは、最初にデータからゼロを削除し、縮小されたデータのセットでテストを実行することを提案しました。ゼロ以外のタイがない場合、この手順は条件付き(数。分布無料テスト)ゼロであり、重要な値の既存の正確なテーブルが使用されることを可能にするこのような理由から、ノンパラメトリック統計上のほとんどの本は、「テストの彼らの記述にウィルコクソンの方法を取り入れる
クリストファー・アデン

確かに、これはウィルコクソンの符号付きランク検定に関するものですが、他のNP手順で使用される同様のアドバイスを聞いたことがあります。Mann-Whitneyの例に関しては、本に戻ってチェックインしましたが、私が間違っていることは正しいです。Mann-Whitneyでは、同値のランクの平均化を推奨しています。つまり、ランク6と7が同値の場合、それぞれに6.5の値を与えます。
クリストファーアデン

2
ありがとうございました。関連付けられたグループを説明する厳密な方法があります。多くの場合、検閲された値は大きな拘束されたグループを構成するため、検閲された(ただし連続した)データを扱う場合、これらは重要です。Kruskal-WallisおよびWilcoxon Rank Sumテストについては、RO Gilbertの18章「環境汚染モニタリングの統計的方法」を参照してください。」タイデータを含む数式は複雑になる場合がありますが、場合によっては(KWテストなど)ランクのANOVAテーブルを計算しています
whuber

回答:


14

ノンパラメトリックに関する作業の大部分は、元々、つながりが不可能な基礎となる連続分布があると仮定して行われました(十分に正確に測定された場合)。理論は、順序統計量の分布(関係なしで非常に単純です)または他の式に基づいて作成できます。場合によっては、統計はほぼ正常であることが判明し、非常に簡単になります。データが丸められているか、自然に離散的であるために関係が導入されると、標準的な仮定は成り立ちません。場合によっては近似で十分な場合もあればそうでない場合もあるので、最も簡単なことは、これらの式が同数では機能しないという警告を出すことです。

タイが存在する場合に正確な分布を算出したいくつかの標準ノンパラメトリックテスト用のツールがあります。RのexactRankTestsパッケージはその一例です。

関係を処理する1つの簡単な方法は、順列テストやブートストラップなどのランダム化テストを使用することです。これらは漸近的な分布については心配しませんが、データをそのまま使用し、結び付けてすべてを使用します(多くの結び付けでは、これらの手法でも電力が低くなる可能性があることに注意してください)。

数年前の記事がありましたが(アメリカの統計学者では考えていましたが、私はそれを見つけていません)、関係のアイデアとそれらでできることのいくつかを議論しました。一つのポイントは、あなたが尋ねている質問に依存するということです。関係をどうするかは、優越性テストと非劣性テストで非常に異なる場合があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.