分布の違いの重要性の評価


21

2つのデータグループがあります。それぞれが複数の変数の異なる分布を持つ。これら2つのグループの分布が統計的に有意な方法で異なるかどうかを判断しようとしています。データは生の形式であり、それぞれに頻度カウントがある個別のカテゴリを扱いやすいようにビニングされています。

これらの2つのグループが大幅に異なるかどうかを判断するには、どのテスト/手順/方法を使用する必要があり、SASまたはR(またはオレンジ)でそれを行うにはどうすればよいですか?


2
分布が異なる形式(たとえば、正規分布、ポアソンなど)なのか、パラメーターが異なる(たとえば、正規分布の平均値またはsd)のいずれか、または両方に興味がありますか?
ジェロミーアングリム

回答:


15

これには、2サンプルのコルモゴロフ-スミルノフ検定などが必要だと思います。2サンプルコルモゴロフ–スミルノフ検定は、2つのサンプルの経験分布関数(ECDF)の違いの比較に基づいています。つまり、2つのサンプルの位置と形状の両方に敏感です。また、多変量形式に一般化します。

このテストは、Rのさまざまなパッケージのさまざまな形式で検出されるため、基本的に習熟している場合は、そのうちの1つ(fBasicsなど)をインストールし、サンプルデータで実行するだけです。


5
デフォルトの「stats」パッケージのR ks.testでは、追加のパッケージをインストールせずにKSテストを実行できます。
ラッセルピアス

SASでは、KSテストはで利用できますproc npar1way。Rには、に加えてks.test()nortest他のいくつかの調整テストを提供するパッケージがあります。
chl

8

私はコンサルタントの愚かな質問をするつもりです。これらの分布が統計的に有意な方法で異なるかどうかを知りたいのはなぜですか?

使用しているデータは、母集団またはプロセスからの代表的なサンプルであり、それらの母集団またはプロセスが異なるという証拠を評価したいですか?もしそうなら、統計的検定はあなたにぴったりです。しかし、これは私にとって奇妙な質問のようです。

または、真実に関係なく、それらの集団またはプロセスが異なるかのように振る舞う必要があるかどうかに興味がありますか?次に、損失関数、理想的には意味のある単位を返す関数を決定し、(a)母集団を異なるものとして扱い、(b)それらを同じものとして扱うときに予想される損失を予測する方が良いでしょう。または、多少保守的なポジションを採用したい場合は、損失分布の分位を選択できます。


あなたの口調は少しぎくしゃくしており、卑劣です...しかし、あなたは正しいです、私が本当に望んでいたのは、2つの分布が同じであると合理的に仮定できるかどうかだったと思います。
ジェイスティーブンス

3
あなたは私のトーンが好きではないことを申し訳ありません。2つの分布が同じであると合理的に仮定できるかどうかを知りたい場合、KSは2つの分布が同じであるという帰無仮説をテストするため、誤解を招きます。
アンドリューロビンソン

5

相対的な分布方法を適用することに興味があるかもしれません。1つのグループを参照グループ、もう1つのグループを比較グループと呼びます。確率-確率プロットの作成と同様の方法で、密度の比率である相対CDF / PDFを作成できます。この相対密度は推論に使用できます。分布が同一である場合、均一な相対分布が期待されます。均一性からの逸脱を調査および調査するためのグラフィカルおよび統計ツールがあります。

より良い感覚を得るための良い出発点は、Rで相対分布法を適用し、Rreldistパッケージを適用することです。詳細については、ハンドコックとモリスによる社会科学の相対分布法の本を参照する必要があります。関連する技術をカバーする著者による論文もあります。


2

2つの分布の差の1つの尺度は、「最大平均不一致」基準です。これは、基本的に、再現カーネルヒルベルト空間(RKHS)の2つの分布からのサンプルの経験的平均の差を測定します。このペーパー「2つのサンプル問題のカーネルメソッド」を参照してください。


私の意見では、この方法は最も堅牢ですが、分布のサンプルが有限である場合は同じように機能するため、よく知られていません(したがって、サンプル分布は完全に連続的ではありません)。また、私が知っている限り、KSテストではまだ活発な研究である多項分布でも機能します
-www3

-1

SAS / R / Orangeの使用方法はわかりませんが、必要なテストはカイ2乗テストのようです。


Chi-Sqは、主にカテゴリカルデータ(コンティンジェンシーテーブル)対連続用だと思いましたか?
ジェイスティーブンス

1
うーん、私はKSテストの答えが私のものよりも好きです!
Suresh Venkatasubramanian

1
いいえ、これは正しくありません。
-SmallChess
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.