相関ランダム変数を生成する式はどのように機能しますか?


19

2つの通常の非相関ランダム変数場合、次の式で2つの相関ランダム変数を作成できます。X1,X2

Y=ρX1+1ρ2X2

そして、はと相関持ちます。ρ X 1YρX1

誰かがこの式の由来を説明できますか?


1
stats.stackexchange.com/a/71303での私の回答には、この問題と関連する問題に関する広範な議論が掲載されています。特に、(1)Normalityの仮定は無関係であり、(2)追加の仮定を行う必要があることをしますと相関がになるためには、と分散が等しくなければなりません。X 2 Y X 1 ρX1X2YX1ρ
whuber

非常に興味深いリンク。正常性が無関係であることの意味を理解していない。場合または正常ではない、それはの密度を制御しにくくなるカイザー-ディックマンアルゴリズムによって。(例えば、Headrick、2002; Ruscio&Kaczetow、2008;ヴェイル&Maurelli、1983)これは特殊なアルゴリズム非正規相関データを生成するための全体の理由です。たとえば、あなたの目標は生成することであると想像X〜通常、Y〜制服を、\ rho = .5で。X_2〜uniformを使用すると、Yは均一ではなくなります(Yは通常と均一の線形結合になります)。X 2 Y X Y ρ X 2 Y YX1X2YXYρX2YY
アンソニー

@Anthonyこの質問では、純粋に1次モーメントと2次モーメントの関数である相関についてのみ質問します。答えは、分布の他のプロパティに依存しません。あなたが議論しているのは、まったく異なる主題です。
whuber

回答:


17

次のようなと線形結合を見つけたいとしますX 2X1X2

corr(αX1+βX2,X1)=ρ

と両方に同じ(ゼロ以外の)定数を掛けても、相関は変わらないことに注意してください。したがって、分散を維持するための条件を追加します。β VAR α X 1 + β X 2= VAR X 1αβvar(αX1+βX2)=var(X1)

これは次と同等です

ρ=cov(αX1+βX2,X1)var(αX1+βX2)var(X1)=αcovX1バツ1=varバツ1+βcovバツ2バツ1=0varαバツ1+βバツ2varバツ1=αvarバツ1α2varバツ1+β2varバツ2

両方の確率変数の分散が同じであると仮定すると(これは重要な仮定です!)()、varバツ1=varバツ2

ρα2+β2=α

この方程式には多くの解決策がありますので、分散を維持する条件を思い出してください。

varバツ1=varαバツ1+βバツ2=α2varバツ1+β2varバツ2α2+β2=1

そして、これは私たちを導く

α=ρβ=±1ρ2

UPD。2番目の質問について:はい、これはホワイトニングとして知られています。


9

方程式は、コレスキー分解の簡略化された二変量形式です。この単純化された方程式は、Kaiser-Dickmanアルゴリズムと呼ばれることもあります(Kaiser&Dickman、1962)。

このアルゴリズムが適切に機能するには、と分散が同じでなければならないことに注意してください。また、アルゴリズムは通常、通常の変数で使用されます。場合はや正常でない、同じ分布の形がない場合があります。X 2 X 1 X 2 Y X 2バツ1バツ2バツ1バツ2Yバツ2

参照:

Kaiser、HF、Dickman、K。(1962)。任意の母集団相関行列からのサンプルおよび母集団スコア行列とサンプル相関行列。Psychometrika、27(2)、179-182。


2
標準化された正規変数は必要ないと思います。同じ分散があれば十分です。
アルテムソボレフ

2
いいえ、の分布ありません混合あなたが主張するような分布。Y
ディリップサルワテ

要点、@ Dilip Sarwate。またはX 2のいずれかが非正規の場合、Yは2つの変数の線形結合になり、目的の分布にならない場合があります。これが、非正規相関データを生成するための(Kaiser-Dickmanではなく)特殊なアルゴリズムの理由です。バツ1バツ2Y
アンソニー

3

cosnthnthcosθsnθバツ1バツ2
ρ=cosθ1ρ2=±snθ

バツ1バツ2


2
当サイトへようこそ!を使用して数式をマークアップすると、投稿がより注目されると思いますTEバツ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.