離散データを使用したコルモゴロフ-スミルノフ:Rでのdgof :: ks.testの適切な使用とは?


23

初心者の質問:

2つの個別のデータセットが同じ分布に由来するかどうかをテストします。コルモゴロフ・スミルノフのテストが提案されました。

Conover(Practical Nonparametric Statistics、3d)は、コルモゴロフ-スミルノフ検定をこの目的に使用できると言っているようですが、その動作は離散分布で「保守的」であり、ここで何を意味するのかわかりません。

別の質問に対する DavidRのコメントは、「... KS統計に基づいてレベルα検定を作成することはできますが、シミュレーションなどによって重要な値を取得する他の方法を見つける必要があります。」

dgof Rパッケージ(articlecran)のks.test()のバージョンは、statsパッケージのks.test()のデフォルトバージョンにはない機能を追加します。とりわけ、dgof :: ks.testには次のパラメーターが含まれています。

simulate.p.value:離散適合度検定のみのために、モンテカルロシミュレーションによってp値を計算するかどうかを示す論理値。

Simulate.p.value = Tの目的は、DavidRが提案することを達成することですか?

たとえそうであっても、2サンプルテストにdgof :: ks.testを本当に使用できるかどうかはわかりません。連続分布に対して2サンプルのテストのみを提供しているように見えます。

yが数値の場合、xとyが同じ連続分布から引き出されたという帰無仮説の2標本検定が実行されます。

または、yは連続(累積)分布関数(またはそのような関数)を指定する文字列、または離散分布を与えるecdf関数(またはクラスstepfunのオブジェクト)にすることができます。これらの場合、1サンプルテストは、xを生成した分布関数が分布y ...であるというヌルから実行されます。

(背景の詳細​​:厳密に言えば、基礎となる分布は連続的ですが、データは少数のポイントに非常に近い傾向があります。各ポイントはシミュレーションの結果であり、-1から10までの実数の平均です。 1.シミュレーションの終わりまでに、これらの数値はほぼ常に.9または-.9に非常に近いため、平均値はいくつかの値に集中し、それらを離散として扱います。シミュレーションは複雑で、データが既知の分布に従うと考える理由。)

助言?


ここでGs 博士のコメントに気付きました。これは、ks.bootが必要なものあることを示唆していますが、dgof :: ks.testのシミュレーションオプションが機能するかどうか、および「convervative」が何を意味するのか、まだ疑問です。
火星

回答:


16

これは、@ jbrucks拡張機能に対する回答です(ただし、元の回答も同様です)。

2つのサンプルが同じ母集団/分布に由来するかどうか、または違いがあるかどうかの一般的なテストの1つは、置換テストです。対象の統計を選択します。これは、KS検定統計、平均値の差、中央値の差、分散の比率、または...になります(質問にとって最も意味のあるものであれば、見やすい条件でシミュレーションを実行できます)どの統計情報が最良の結果を提供するか)、元の2つのサンプルでその統計情報を計算します。次に、グループ間の観測値をランダムに並べ替え(すべてのデータポイントを1つの大きなプールにグループ化し、元のサンプルと同じサイズの2つのグループにランダムに分割します)、並べ替えられたサンプルの対象統計量を計算します。これを何回も繰り返し、サンプル統計の分布はヌル分布を形成し、元の統計をこの分布と比較してテストを形成します。帰無仮説は、平均値/中央値などだけでなく、分布が同一であることに注意してください。等しいです。

分布が同一であると仮定したくないが、means / medians / etcの違いをテストしたい場合。その後、ブートストラップを行うことができます。

データの分布がわかっている(または少なくとも分布を引き受ける意思がある)場合は、パラメーターの等価性について尤度比検定を実行できます(両方のグループの単一のパラメーターセットとモデルをモデルと比較します)パラメータの個別のセットを使用)。尤度比検定は通常、多くの場合良好なカイ2乗分布(漸近線)を使用しますが、小さなサンプルサイズを使用している場合、または境界付近のパラメーター(たとえば0の分散)をテストしている場合、近似は順列検定を使用して、より良いヌル分布を取得することもできます。

これらのテストはすべて、連続分布または離散分布で機能します。また、不確かさの量を示すパワーまたは信頼区間の指標を含める必要があります。有意性の欠如は低パワーによるものである可能性があり、統計的に有意な差は依然として実質的に意味がない可能性があります。


グレッグ、ありがとう。これはjbruckの質問に対する非常に役立つ一般的な回答であり、私にとっても役立ちます。(私の質問は、より具体的でした。答えを期待するには狭すぎるかもしれません。)
火星

1
@Mars、私の答えは少なくともあなたの部分に間接的に答えていると思います。通常のKS検定は同順位がないと仮定し、帰無仮説の下で検定統計量の理論モデルを使用します。同数の場合、理論モデルは正確ではありませんが、代わりにシミュレーション(置換テスト、null distからのシミュレーションなど)を使用してnull分布を計算し、p値などを取得できます。あなたが言及した議論はします。
グレッグスノー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.