これらの各方法を使用して相関を計算する必要があるのはいつですか?


8

データ分析にRを使用しています。Rはcorr、相関を計算するための関数を提供します。この関数corr、ピアソン、スピアマン、ケンドールを推定するための3つの異なるアプローチ/アルゴリズムを提供します。これらの各方法をいつ使用する必要がありますか?どの方法を使用する必要があるかを決定する要因は何ですか?


これはRのコンテキストにありますが、問題は確かに3つの統計的測定値の違いについてです。私も移行すると思います。
Sean Owen、2014年

1
この質問は、stats.stackexchange.com / questions / 45897 /…ですでに質問されています(まだ回答を得ていません)。私たちのサイトには、相関、特にピアソンとスピアマンの係数の比較に関する広範な資料があります。stats.stackexchange.com/…で検索結果を参照してください。
whuber

回答:


10

ピアソンの積率係数(ピアソンパラメーター)は、変数間の線形相関を測定します。したがって、疑わしい相関が線形で、プロットで視覚的に検査できる場合に適しています。

ケンドールタウ係数(ケンダルパラメーター)とスピアマンの相関係数(スピアマンパラメーター)は、メジャーランク相関です。したがって、2つの変数間の相関関係は線形である必要はありません。スピアマン法は基本的にピアソン法ですが、値のランクに適用されます(値のランクは、値をソートした後の位置によって与えられます)。ケンダル法は、基本的に、追加の順序付きペアの数とペアの総数の間の比率の形の統計として構築されます。ケンダル法の場合、統計として構築されるため、仮説検定のフレームワークで使用して構築することもでき、すべての利点があります(これはタウ検定と呼ばれます)。

これらのメソッドはすべて、確率変数間の依存関係について推測するために使用される手段です。相関と依存に特化したウィキペディア専用ページで詳細をご覧ください


SpearmanとPearsonも線形関係で同一でなければならないというのも真実ではないので、疑わしい場合はSpearmanを使用でき、相関関係が非線形であってもスローされないことを確信できますか?
cwharland 2014年

1
正直なところ、それらが線形関係で等しいかどうかはわかりません。ランクのピアソンが槍兵であることは確かです。ただし、ランク付けへの変換中に、いくつかのことが起こります。ピアソンは外れ値に対してより堅牢になり、共分散は非常に変更され、ピアソンはおそらく非独立ノイズを組み込みます(おそらく交絡因子によって生成されます)。一般に、ピアソンを線形ベースの推論に使用し、スピアマンを使用して線形以外の何かがあるかどうかを確認し、さらに序数(スピアマンに対してのみ意味があります)を使用します。
rapaio 2014年

@cwharland実際、それらは線形関係では等しくない傾向があります。相関する2変量正規サンプル(提案する線形関係)では、通常、スピアマン相関は(平均および分布の中央値の両方で)ピアソンよりも0に近くなります。どちらも偏っていますが、ピアソンはそれほど偏っていません。
Glen_b-モニカを復活させる14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.