2つの特性に既知の相関がある場合、ランダムなペアに対してそれらが「整列」する確率を予測できますか?
それは、どの人口相関を見るかに依存します。
あなたが言及したピアソン相関()の場合、答えは「いいえ」です。(ロバートFの答えは正しいです)ρ
代わりに、連続的な2変量分布の母集団ケンドール相関(ケンドールのタウ、ここではと表記)がいる場合、答えは実際にはイエスです。τK
母集団ケンドール相関は、一致ペアの確率と不一致ペアの確率の差です。
τK=pC−pD
(サンプルのケンドール相関は同様に、一致および不一致ペアのサンプル比率の違いです)。
連続二変量の集団であるため、あなたが知っていればあなたが計算できる:pC+pD=1τKpC
τK=pC−pD
=pC−(1−pC)
=2pC−1
したがって、、素晴らしいシンプルな結果です。pC=12(τK+1)
一方であなたが(少なくとも連続場合)を求める確率を決定し、関係と変数間の二変量の関係(すなわちの構造に依存コピュラ)。τKρτK
2変量正規性を仮定すると、と間の(非線形)接続をできます。実際、これはよく知られている結果です。我々は持っています:τKρ
τK=2πarcsin(ρ)
-Embrechtsらのセクション5.3.2を参照してください。(2005)[1]。その結果は、Meyer(2009)[2]などのさまざまな場所でも見られます。だからその場合
pC=arcsin(ρ)π+12.
(ただし、2変量正規性の仮定は、BMIと血圧については疑わしいと思われます)
とこの関係は、より一般的には楕円分布に当てはまります。たとえば、Lindskog、McNeil、&Schmock(2003)[3]を参照してください。ただし、繰り返しになりますが、BMIと血圧に関するこの仮定は疑わしいかもしれません。たとえば、実際には両方の測定値が右スキューである傾向があります。τKρ
[1] Embrechts、P.、Frey、R。、マクニール、AJ(2005)、
定量的リスク管理:概念、手法、ツール、
金融のプリンストンシリーズ、プリンストン大学出版局
[2]マイヤーC.(2009)、
二変量正規コピュラ、
arXiv:0912.2816v1 [math.PR] pdf (12月15日)
[3] Lindskog、F.、McNeil、AJ、Schmock、U.、(2003)、
"Kendall's tau for elliptical distributions"
in:Credit Risk; 測定、評価、管理、編集 G.ボル他、
経済への貢献、Physica-Verlag Heidelberg、pp.149–156。
(またはhttp://www.macs.hw.ac.uk/~mcneil/ftp/KendallsTau.pdfを参照してください)