Rでの1標本Kolmgorov-Smirnov検定における「関係は存在すべきではない」


12

私はコルモゴロフ・スミルノフ検定を使用して、RでのMYDATAの正規性をテストします。これは私が行うことの例です

 ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA))

ここにRが私に与えた結果があります:

 data:  MYDATA
 D = 0.13527, p-value = 0.1721
 alternative hypothesis: two-sided

 Warning message:
 In ks.test(MYDATA, "pnorm", mean(MYDATA), sd(MYDATA)) :
    ties should not be present for the Kolmogorov-Smirnov test

問題があると思いますが、この警告の「関係」とはどういう意味ですか?


2
なぜこの正規性テストを実行したいのですか?ほとんどの場合、変数の正常性をテストすることは かなり無駄です回帰以下の残差の正規性をテストすることが重要であってもよいです。
EdM 2016

2
結びつきがなくても、KS検定は一般的な正規性の検定ではなく、完全に指定された分布の検定です(データから平均とsdを推定しています)。あなたのp値はナンセンスになります。
Lilliefors

回答:


10

ここには2つの問題があります。

KSテストは継続的な分布のためのものであり、MYDATAにタイ(反復値)を含めないでください。

KSテストの基礎となる理論では、これまでのようにデータから分布のパラメーターを推定することはできません。ks.testのヘルプでこれについて説明しています。


何故ks.test二標本ケースでは、ネクタイは両方から削除することにしたいxy?私が意味する、私は何のつながりをでていないxyunique(x)unique(y))が、二つのベクトルは、共通の値を持っています。内xと内の値の間でのみ関係を考慮する必要はありませんyか?
ネメシ

@Nemesi新しい質問がある場合は、[質問する]ボタンを使用して質問してください。
mdewey

私、これは別の質問であることが十分ではありませんでしたが、ここではあるけれども:stats.stackexchange.com/questions/389151/...
Nemesi

5

@mdeweyで説明されているように、KSテストは、データからパラメーターを推定する場合には適していません。次のコードを使用できます。これは、正規性についてAnderson-Darlingテストに依存しており、平均値とstddevを指定する必要がありません。このテストは、Lillieforsテストよりも精度が高くなっています。

install.packages("nortest")
library(nortest)
ad.test(MYDATA)

「正確さ」は、狭くても見当違いの検索の場合があります。どちらの場合も、これらのテストのほとんどのアプリケーションは、最悪の場合役に立たず、ほとんどの場合は誤解を招きます。回帰法についての仮定を正しく理解していない人から、それらを使用するように教えられることがよくあります。KSテストの相対的な弱点は、その結果がナイーブユーザーに誤解を与える可能性が低くなるため、より強力な代替手段を使用するほうが実際には「より良い」ものになると思います。
DWin
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.