Rのwilcox.testとcoin :: wilcox_testの違いは何ですか?


13

これらの2つの関数はRに存在しますが、それらの違いはわかりません。で呼び出すwilcox.testと、同じp値のみを返すようですcorrect=FALSE、とwilcox_testとの(コインパッケージ内)distribution="aymptotic"。他の値の場合、異なるp値を返します。またwilcox.test、パラメータの設定とは関係なく、データセットに対して常にW = 0を返します。

x = c(1, 1, 1, 3, 3, 3, 3) そして y = c(4, 4, 6, 7, 7, 8, 10)

また、R以外のさまざまなツール(オンラインで利用できるもの、Excelアドオンとして利用できるもの)を使用しようとすると、異なるp値が報告されることがあります。

それで、どのツールが「正しい」p値を与えているかをどうやって知ることができますか?

「正しい」p値はありますか、またはいくつかのツールがp値を0.05未満にする場合、私は幸せでしょうか?(これらのツールはRのようなパラメーター化の可能性をあまり提供しない場合があります。)

ここで何が欠けていますか?

回答:


18

質問の鍵は、Notesセクションの?wilcox.testにあります。

文献は、ウィルコクソンの順位和とマン・ホイットニー検定の定義について全会一致ではありません。

つまり、このことは、2つのサンプル間の位置の変化のこのノンパラメトリックテストを行う方法が複数あるということです。さらに、各定義が与えられた場合、p値を取得する方法は複数あります。「正確」とは絶対に正しいことを意味し、「近似」または「漸近的」は両方とも真実の近似です。だからこそ、との両方に複数のオプションがwilcox.test()ありwilcox_test()、それらの一部のみが完全に一致します-両方の機能がまったく同じことをしている場合。wilcox_test()タイ値がある場合でも正確なp値を取得できるように見えますが、タイ値がある場合はwilcox.test()漸近近似にフォールバックします。Excelアドオンが統計とp値の計算をどのように組み合わせているかわかりませんが、

次の質問は、wilcox.test()常に0を返す理由です。作成したデータセットの場合、wilcox.test(x、y)を実行すると検定統計量の値は0になりますが、wilcox.test(y、x)を実行すると49になりますが、p値は同じ。理由については、ウィキペディアのページご覧くださいwilcox_test()は、によって返される統計のZ変換を返しますwilcox.test()。これが、検定統計の値が異なる理由です。

正しいp値はありますか?はい。ただし、計算が難しい場合があるため、近似メソッドを使用する必要があります(メモリ不足から正確な計算が失敗する方法については、?wilcox_testを参照してください)。近似値と正確な値の違いは、2つのグループの場所の実際の違いが非常に小さい場合を除き、ほとんど問題になりません。


(+1)私たちのサイト、ドリューへようこそ!
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.