ケンドール・タウまたはスピアマンのロー?


69

どちらの場合に、他よりもどちらを好むべきですか?

教育的理由から、ケンドールの利点を主張する人を見つけましたが、他の理由はありますか?


関連する質問stats.stackexchange.com/q/18112/3277も参照してください。
ttnphns

1
残念ながら、あなたの質問のリンクは死んでいます。あなたはNoether(2007、Teaching Statistics)に言及していると思います。編集しますか?
S. Kolassa -モニカ元に戻し

回答:


40

スピアマン相関は、測定スケールで整数値のスコアを扱う場合、中程度の数の可能なスコアがある場合、または二変量関係に関する仮定に依存したくない場合に、通常の線形相関の代わりに主に使用されることがわかりました。ピアソン係数と比較して、ケンドールのタウの解釈は、考えられるすべてのペアワイズイベント間の一致ペアと不一致ペアの%の差を定量化するという意味で、スピアマンのローの解釈よりも直接的ではないようです。私の理解では、ケンドールのタウはグッドマン-クラスカルガンマにより似ています。

J. Statistics EducのLarry Winnerの記事を参照しました。(2006)両方の手段の使用を議論する、NASCAR Winston Cup Race Results for 1975-2003

この点で、非正規データとのピアソンまたはスピアマンの相関関係に関する@onestopの回答も興味深いものでした。

注目すべきことに、ケンドールのタウ(aバージョン)は、予測モデリングに使用されるサマーズD(およびハレルのC)に接続しています(たとえば、RBニューソンによる4つの単純なモデルとその中のリファレンス6 でのサマーズDの解釈、およびニューソンによる記事を参照)Stata Journal 2006に掲載されました)。ランクサムテストの概要は、JSS(2006)で公開された「ランク統計のジャックナイフ信頼区間の効率的な計算」に記載されています。


答えてくれたchlに感謝します。ベスト、タル
タルガリリ

スピアマンは、2つの整数変数を定期的に結び付けて使用していましたが、これはケンドールのタウによってうまく処理されているようです。
ヴィニエフ

29

Kendall&Gibbons(1990)によると、名誉ある紳士に以前の答えを参照してください:「...スピアマンのr Sの信頼区間は、ケンドールのτパラメーターの信頼区間よりも信頼性が低く、解釈しにくい」。


1
私は彼の記事から引用しているだけなので、感謝はロジャー・ニューソンによるものだと思います。
ワンストップ

22

再び幾分哲学的な答え。基本的な違いは、スピアマンのRhoは非線形相互作用に対してR ^ 2(「分散の説明」)のアイデアを拡張する試みであるのに対して、ケンドールのTauはむしろ非線形相関検定の検定統計量であることを意図しています。そのため、RauをR拡張としてRhoとして非線形相関をテストするためにTauを使用する必要があります(または、R ^ 2に精通している人-限られた時間で疑うことなく聴衆にTauを説明するのは苦痛です)。


6
「非線形相互作用」について説明してください。スピアマンローは、心理測定の観点から妥当性係数の尺度を反映しているようです。タウの性質については知りません。
サブハッシュC.ダバール

私はあなたのコメントの心理測定のことを理解していません。
レオレオポルドヘルツ

1
xx2

1
これは、xが負でない場合にのみ当てはまります。
aocall

17

理論的理由からスピアマンのρよりもケンダルのτを主張しているアンドリュー・ギルピン(1993)からの引用は次のとおりです。

「[ケンドールの】より迅速に正規分布に近づくとして、、サンプルサイズ、増加;および関係が存在する場合は特に、数学的に、より扱いやすいです。」 ρ N ττρNτ

参照

ギルピン、アーカンソー(1993)。メタ分析の効果の大きさのコンテキスト測定値内でのケンドールのタウからスピアマンのローへの変換の表。 教育および心理測定、53(1)、87-92。


3

FWIW、Myers&Wellからの引用(研究デザインと統計分析、第2版、2003年、510ページ)。それでもp値を気にする場合;

シーゲルとカステラン(1988、行動科学のためのノンパラメトリック統計が)が、ことを指摘およびスピアマン同じデータセットに対して計算するときのための有意性検定する際、一般的に、異なる値を持つことになりますおよびスピアマン基づいていますそれらのサンプリング分布では、同じp値が得られます。ρ τ ρτρτρ


彼らがこの主張に対して何らかのサポートを提供しているかどうか知っていますか?私はそれが実際に一般的にどのように真実になるかわかりません(それらはかなり頻繁に似ているかもしれませんが、それらが同じであるという主張がどのように持ちこたえることができるか本当にわかりません)。[シーゲルとカステランが本当にそれを正確に言ったのか、それとも少し違うのか。]
Glen_b

Siegel&Castellan(2ed p253)を確認しました。彼らは少し異なることを言います...しかし、実際には上記の言い換えよりもわずかに悪いです。「およそ」を追加しても(さらに悪いのは、nullの場合に制限されているためですが、データを調整しているためです)とにかく、固定次数の場合、すべての可能な次数はH0の下で等しく発生する可能性があります。)データの条件付け後にnullの条件付けが重要であると考えるという事実は心配です。彼らは何か他のことを言うyxy
つもり

反例として、n = 7と正確なp値を取ります。x = 1,2,3,4,5,6,7とし、y = 2,1,4,3,7,6,5とする...スピアマンはp = 0.048を与え、ケンドールは0.136を与える...まったく同じではありません。異なる配置はケンドールに同じ値を与えますが、スピアマンはp = 0.302です。多くのそのような例とさまざまなサンプルサイズがあります
Glen_b

3
これは、n = 8の場合のプロットです。あなたがあります見ての通り、多くの相関関係の2つの指標のためのp値の間の変動の:i.stack.imgur.com/5JMbj.pngが ...私はこの上のQ&Aを書き込むこと
Glen_b

1
以下は、スピアマン相関p値は同じですが、ケンドール相関p値がまったく異なる2つのケース(今回はn = 9)を示す2つのサンプルデータセット(ランキング後)です。i.stack.imgur。 com / 3ILD8.png
Glen_b
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.