離散サポート分布では、相関の線形表現を使用できません。
二項分布の特殊なケースでは、表現
を利用できます
のいくつかをのいくつかと等しくなるよう
に選択し、それ以外の場合は個別に生成すると、
ここで、は、ベルヌーイとして生成されるのではなく、がと同じように選択されることを示しますCOV (X 、Y )= 8 Σ iが= 1 18 Σの J = 1つの COV (δ I、
X=∑i=18δiY=∑i=118γiδi,γi∼B(1,2/3)
δ I γ jの COV (X 、Y )=を8 ∑ i = 1 18 ∑ j = 1cov(X,Y)=∑i=18∑j=118cov(δi,γj)
δiγjI(δ I:= γ J)δ I γ jの B (1 、2 / 3 )cov(X,Y)=∑i=18∑j=118I(δi:=γj)var(γj)
I(δi:=γj)δiγjB(1,2/3)。
制約は、解決する必要があります
これは、 8つののうちの6つを18ののうちの6つに等しいとすると、この相関は0.5になります。
cov(X,Y)=0.5×8×18−−−−−√×23×13
∑i=18∑j=118I(δi:=γj)=0.5×8×18−−−−−√=6
δiγj
実装は次のようになります。
- 生成、、。Z∼B(6,2/3)Y1∼B(12,2/3)X1∼B(2,2/3)
- および取りますX=Z+Z1Y=Z+Y1
この結果はRシミュレーションで確認できます
> z=rbinom(10^8,6,.66)
> y=z+rbinom(10^8,12,.66)
> x=z+rbinom(10^8,2,.66)
cor(x,y)
> cor(x,y)
[1] 0.5000539
コメント
これは、が完全な正方形であり、が整数であるためにのみ機能するという点で、問題に対するかなり人工的な解決策です。他の許容できる相関関係の場合、ランダム化が必要になります。つまり、はゼロまたは1で、確率はです。8×18 I(δI:=γJ)ρcor(X,Y)×8×18−−−−−√I(δi:=γj)ϱ
補遺
問題は何年も前にベルヌーリスを共有するという同じアイデアでスタックオーバーフローで提案され、解決されました。