ファイ、マシューズ、ピアソンの相関係数の関係


13

ファイとマシューズの相関係数は同じ概念ですか?2つのバイナリ変数のピアソン相関係数とどのように関連または同等ですか?バイナリ値は0と1であると仮定します。


2つのベルヌーイ確率変数x間のピアソンの相関yは次のとおりです。

ρ=E[(xE[x])(yE[y])]Var[x]Var[y]=E[xy]E[x]E[y]Var[x]Var[y]=n11nn1n1n0n1n0n1

どこ

E[x]=n1nVar[x]=n0n1n2E[y]=n1nVar[y]=n0n1n2E[xy]=n11n

ウィキペディアのファイ係数

統計では、ファイ係数(「平均二乗偶発係数」とも呼ばれ、またはr ϕで表される)は、カールピアソンによって導入された2つのバイナリ変数の関連性の尺度です。この測定は、その解釈におけるピアソン相関係数に似ています。実際、2つのバイナリ変数に対して推定されたピアソン相関係数は、ファイ係数を返します...ϕrϕ

2つのランダム変数yの 2×2テーブルがある場合xy

ここに画像の説明を入力してください

関連を説明PHI係数yがある φ = N 11、N 00 - N 10、N 01xy

ϕ=n11n00n10n01n1n0n0n1

ウィキペディアのマシューズ相関係数

マシューズ相関係数(MCC)は、次の式を使用して混同行列から直接計算できます

MCC=TP×TNFP×FN(TP+FP)(TP+FN)(TN+FP)(TN+FN)

この式では、TPは真陽性の数、TNは真陰性の数、FPは偽陽性の数、FNは偽陰性の数です。分母の4つの合計のいずれかがゼロの場合、分母は任意に1に設定できます。これにより、マシューズの相関係数がゼロになります。これは、正しい制限値であることが示されます。

回答:


14

はい、それらは同じです。マシューズ相関係数は、混乱テーブルへのピアソン相関係数の特定のアプリケーションです。

分割表は、基礎となるデータの要約にすぎません。分割表に表示されるカウントから、観測ごとに1行に戻すことができます。

Wikipediaの記事で使用されている、5つの真の陽性、17の真の陰性、2つの偽陽性、3つの偽陰性の混同マトリックスの例を考えてみましょう。

> matrix(c(5,3,2,17), nrow=2, byrow=TRUE)
     [,1] [,2]
[1,]    5    3
[2,]    2   17
> 
> # Matthews correlation coefficient directly from the Wikipedia formula
> (5*17-3*2) / sqrt((5+3)*(5+2)*(17+3)*(17+2))
[1] 0.5415534
> 
> 
> # Convert this into a long form binary variable and find the correlation coefficient
> conf.m <- data.frame(
+ X1=rep(c(0,1,0,1), c(5,3,2,17)),
+ X2=rep(c(0,0,1,1), c(5,3,2,17)))
> conf.m # what does that look like?
   X1 X2
1   0  0
2   0  0
3   0  0
4   0  0
5   0  0
6   1  0
7   1  0
8   1  0
9   0  1
10  0  1
11  1  1
12  1  1
13  1  1
14  1  1
15  1  1
16  1  1
17  1  1
18  1  1
19  1  1
20  1  1
21  1  1
22  1  1
23  1  1
24  1  1
25  1  1
26  1  1
27  1  1
> cor(conf.m)
          X1        X2
X1 1.0000000 0.5415534
X2 0.5415534 1.0000000

ありがとう、ピーター!数学的には、ファイとマシューが2つのバイナリランダム変数に対してピアソンと同等なのはなぜですか?
ティム

ピアソン相関の定義を取り、それを操作して、個々の観測値と平均値との差の合計ではなくカウントを参照するようにすると、マシューズの公式が得られます。私は実際にこれをやったことはありませんが、それはかなり簡単でなければなりません。
ピーターエリス

2

E[バツy]n1n1n2

n11n×1×1+n10n×1×0+n01n×0×1+n00n×0×0=n11n

ρ=ϕ

n11nn1n1=n11n01+n10+n11+n00n11+n10n11+n01=n11n00n10n01
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.