線形回帰がピアソンの相関に関連している場合、ケンドールとスピアマンの相関に関連する回帰技術はありますか?


27

たぶんこの質問は素朴ですが、:

線形回帰がピアソンの相関係数と密接に関連している場合、ケンドールとスピアマンの相関係数と密接に関連する回帰手法はありますか?


3
線形回帰:あなたが説明1と従属変数有する簡単な例としてランクのし、回帰係数としてスピアマンの相関係数を生じます。そして、この場合、とは回帰で交換可能です。y x yxyxy
COOLSerdash

2
ほんの少しの考え。ケンドールのとスピアマンのは、両方ともランクに基づく相関係数です。と間で求められている関係には、ランクを含める必要があります。ただし、ランクを計算すると、観測間に依存関係が導入され、これにより、誤差項間に依存関係が課され、線形回帰が排除されます。ただし、異なる設定では、コピュラを使用してと間の依存構造をモデリングすると、コピュラの選択に応じて、ケンドールのおよび/またはスピアマンのとのリンクが可能になります。ρ X 、Y 、X 、Y τ ρτρxyxyτρ
QuantIbex

1
@QuantIbexは、その依存関係が必ず暗示していますか?E[εiεj]0
シャドウトーカー14

回答:


21

ほとんどすべての相関測定を使用して線形回帰を近似し、ピアソン相関を使用すると最小二乗を再現する非常に簡単な手段があります。

関係の勾配がである場合、と間の相関はになると予想されることを考慮してください。Y - β X X 0βyβxx0

確かに、それが以外の場合は、キャプチャされていない線形関係があります。これが相関測定で取り上げられます。0

したがって、と間のサンプル相関をする勾配を見つけることにより、勾配を推定でき。多くの場合、たとえばランクベースのメジャーを使用する場合、相関は勾配推定値のステップ関数になるため、間隔がゼロになる場合があります。その場合、通常はサンプル推定値を間隔の中心に定義します。多くの場合、ステップ関数はある点でゼロより上からゼロより下にジャンプします。その場合、推定値はジャンプポイントにあります。 Y- βのxのx0β~yβ~xx0

この定義は、たとえば、あらゆる種類のランクベースの堅牢な相関関係で機能します。また、傾斜の間隔を取得するために使用することもできます(通常の方法で-有意な相関とわずかな相関の境界を示す傾斜を見つけることにより)。

もちろん、これは勾配のみを定義します。勾配が推定されると、切片は残差計算された適切な位置推定に基づくことができます。ランクベースの相関では、中央値が一般的な選択肢ですが、他にも多くの適切な選択肢があります。yβ~x

carR のデータの傾きに対してプロットされた相関関係は次のとおりです。

ここに画像の説明を入力してください

ピアソン相関は最小2乗勾配で
0を交差します。3.932 ケンドール相関はテイルセン勾配で
0を交差します。3.667

これらは、この例の3つの勾配推定値です。ここで、インターセプトが必要です。簡単にするために、最初の切片には平均残差を使用し、他の2つの切片には中央値を使用します(この場合はそれほど重要ではありません)。

           intercept
 Pearson:  -17.573 *     
 Kendall:  -15.667
 Spearman: -16.285

*(最小二乗とのわずかな差は、勾配推定値の丸め誤差によるものです。他の推定値にも同様の丸め誤差があることは間違いありません)

対応するフィット線(上記と同じ配色を使用)は次のとおりです。

ここに画像の説明を入力してください

編集:比較すると、象限相関スロープは3.333です

ケンドール相関とスピアマン相関の両方の勾配は、最小二乗よりも影響力のある外れ値に対して実質的に堅牢です。ケンドールの場合の劇的な例については、こちらをご覧ください。


(+1)すばらしい説明!この文脈において、KendallがSpearmanよりも好ましいと思われる理由はありますか(少なくとも、Kendall相関は、名前がTheil-Senであるのに対し、Spearmanはそうではない勾配推定量に対応するという事実から判断します)?
アメーバは、モニカを復活させる14

4
これが事実であると思われる理由はいくつかあります。まず、Theil-Senラインには、スピアマンにはない単純な推定値(ペアワイズスロープの中央値)があります。小さなサンプルでは、​​手計算に非常に適しています。ケンドール相関は、より速く正規性に近づき、より数学的に扱いやすくなります。こちらこちらご覧ください
Glen_b -Reinstateモニカ

20

比例オッズ(PO)モデルは、ウィルコクソンおよびクラスカルワリスの検定を一般化します。がバイナリの場合のスピアマンの相関は、単純に変換されたウィルコクソン検定統計量です。したがって、POモデルは統一メソッドであると言えます。POモデルは、一意の値(1より小さい)と同じ数の切片を持つことができるため、順序と連続両方を処理します。Y YXYY

POモデルのスコア統計の分子は、まさにウィルコクソン統計です。χ2

POモデルは、プロビット、プロポーショナルハザード、および相補的なlog-logモデルを含む、より一般的な累積確率モデル(累積呼び出しリンクとも呼ばれます)モデルの特別なケースです。ケーススタディについては、ハンドアウトの第15章を参照してください。


4

アーロン・ハン(1987年の計量経済学)は、タウを最大化することにより回帰モデルに適合する最大ランク相関推定量を提案しました。Dougherty and Thomas(心理学の文献で2012年)は最近、非常によく似たアルゴリズムを提案しました。MRCには、その特性を示す豊富な作業があります。

アーロンK.ハン、一般化回帰モデルのノンパラメトリック分析:最大ランク相関推定量、Journal of Econometrics、Volume 35、Issue 2–3、1987年7月、303-316ページ、ISSN 0304-4076、http:// dx.doi.org/10.1016/0304-4076(87)90030-3。(http://www.sciencedirect.com/science/article/pii/0304407687900303

Dougherty、MR、およびThomas、RP(2012)。非線形の世界での堅牢な意思決定。心理学的レビュー、119(2)、321。http : //damlab.umd.edu/pdf%20articles/DoughertyThomas2012Rev.pdfから取得。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.