3つのベクトルがすべて負のペアワイズ相関を持つ可能性はありますか?


16

3つのベクトル、、および与えられ場合、と、と、およびと間相関がすべて負になる可能性はありますか?すなわち、これは可能ですか?b c a b a c b cabcabacbc

corr(a,b)<0corr(a,c)<0corr(b,c)<0

3
負の相関とは、幾何学的に、中心ベクトルが互いに鈍角をなすことを意味します。このプロパティを持つプレーンで3つのベクトルの構成を描画しても問題はないはずです。
whuber

それらを完全に負の相関関係にすることはできませんが(ρ=1)、一般に、他の相関関係によって設定された境界が負の相関関係になる場合があります。
karakfa

2
@whuberあなたのコメントは、ヘイッキ・プルキネンの答えと矛盾しているようです。あなたがそれを支持するなら、あなたはあなたのコメントを答えに変えるべきです。
RM

2
@RM whuberとHeikkiの間に矛盾はありません。この質問では、n × 3サイズのデータ行列について尋ねます。通常、3次元でn個のデータポイントについて話しますが、このQはn次元で3つの「ベクトル」について話します。ヘイッキは場合、すべての負の相関が起こることができないと言われ、N = 2が(実際、中心後の2つの点が常に完全に相関している相関関係がなければなりませんので、± 1、すべてのことはできません- 1)。Whuberによれば、n次元の3つのベクトルは2次元の部分空間(つまりXXn×3nnn=2±11nXランク2)であり、メルセデスのロゴを想像することを提案します。
アメーバは、モニカを復活

回答:


19

ベクトルのサイズが3以上であれば可能です。例えば

a=(1,1,1)b=(1,9,3)c=(2,3,1)

相関は

cor(a,b)=0.80...cor(a,c)=0.27...cor(b,c)=0.34...

サイズ2のベクトルではこれが不可能であることを証明できます:

cor(a,b)<02(iaibi)(iai)(ibi)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)a1b1+a1b2+a2b1+a2b2<0a1b1+a2b2a1b2+a2b1<0a1(b1b2)+a2(b2b1)<0(a1a2)(b1b2)<0

The formula makes sense: if a1 is larger than a2, b1 has to be larger than b1 to make the correlation negative.

Similarly for correlations between (a,c) and (b,c) we get

(a1a2)(c1c2)<0(b1b2)(c1c2)<0

Clearly, all of these three formulas can not hold in the same time.


3
Another example of something unexpected that only happens in dimension three or higher.
nth

1
With vectors of size 2, correlations are usually ±1 (straight line through two points), and you cannot have three correlations of 1 with three vectors of any size
Henry

9

Yes, they can.

Suppose you have a multivariate normal distribution XR3,XN(0,Σ). The only restriction on Σ is that it has to be positive semi-definite.

So take the following example Σ=(10.20.20.210.20.20.21)

Its eigenvalues are all positive (1.2, 1.2, 0.6), and you can create vectors with negative correlation.


7

let's start with a correlation matrix for 3 variables

Σ=(1pqp1rqr1)

non-negative definiteness creates constraints for pairwise correlations p,q,r which can be written as

pqrp2+q2+r212

For example, if p=q=1, the values of r is restricted by 2rr2+1, which forces r=1. On the other hand if p=q=12, r can be within 2±34 range.

Answering the interesting follow up question by @amoeba: "what is the lowest possible correlation that all three pairs can simultaneously have?"

Let p=q=r=x<0, Find the smallest root of 2x33x2+1, which will give you 12. Perhaps not surprising for some.

A stronger argument can be made if one of the correlations, say r=1. From the same equation 2pqp2+q2, we can deduce that p=q. Therefore if two correlations are 1, third one should be 1.



2

A simple R function to explore this:

f <- function(n,trials = 10000){
  count <- 0
  for(i in 1:trials){
    a <- runif(n)
    b <- runif(n)
    c <- runif(n)
    if(cor(a,b) < 0 & cor(a,c) < 0 & cor(b,c) < 0){
      count <- count + 1
    }
  }
  count/trials
}

As a function of n, f(n) starts at 0, becomes nonzero at n = 3 (with typical values around 0.06), then increases to around 0.11 by n = 15, after which it seems to stabilize:

enter image description here So, not only is it possible to have all three correlations negative, it doesn't seem to be terribly uncommon (at least for uniform distributions).

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.