レビューアーは、スピアマンが適切ではない理由を説明しているはずです。その1つのバージョンを次に示します。データをここで、は測定された変数であり、は性別インジケータです。たとえば、0(男性)、1(女性)です。次に、スピアマンのがそれぞれランクに基づいて計算されます。インディケーター値は2つしかないため、多くの結び付きがあるため、この式は適切ではありません。ランクを平均ランクに置き換えると、2つの異なる値のみが得られます。1つは男性、もう1つは女性です。その後、(Z I、I I)Z I ρ Z 、I I ρρ(Zi,Ii)ZIρZ,IIρ基本的に、2つのグループ間の平均ランクの再スケーリングされたバージョンになります。単純に平均を比較する方が簡単です(より解釈しやすい)!別のアプローチは次のとおりです。
レッツ男性の間で連続変数の観測も、女性の間で同じ。ここで、と分布が同じである場合、は0.5になります(分布が純粋に完全に連続であると仮定してみましょう。一般的な場合、定義します。
ここで、は男性の間のランダムな引き分け、は女性の間の引き分けです。サンプルからを推定できますか?すべてのペア(ないと仮定)、「人が大きい」()(Y 1、... 、Y M X Y P (X > Y )θ = P (X > Y )X Y θ (X I、YのJ)X I > Y jの M X I < Y J W θ MX1,…,XnY1,…,YmXYP(X>Y)
θ=P(X>Y)
XYθ(Xi,Yj)Xi>YjM)および「女性が大きい」数()()。 1つのサンプル推定値は
これは、相関の1つの合理的な尺度です。(わずかな関係しかない場合は、無視してください)。しかし、名前がある場合、それが何と呼ばれるのかわかりません。これは近いかもしれません:
https :
//en.wikipedia.org/wiki/Goodman_and_Kruskal%27s_gammaXi<YjWθMM+W