多変量正規分布の条件付き分布の導出


114

多変量法線ベクトルYN(μ,Σ)ます。分割考えるμおよびY

μ=[μ1μ2]
Y=[y1y2]

\ Sigmaの \ begin {bmatrix} \ Sigma_ {11}および\ Sigma_ {12} \\ \ Sigma_ {21}および\ Sigma_ {22} \ end {bmatrix} Σへの 同様のパーティションを使用して 、({\ boldsymbol y} _1 | {\ boldsymbol y} _2 = {\ boldsymbol a})は、2番目に指定された最初のパーティションの条件付き分布は、 \ mathcal {N}(\ overline {\ boldsymbol \ mu}、\ overline {\ Sigma})です。、平均 \ overline {\ boldsymbol \ mu} = \ boldsymbol \ mu_1 + \ Sigma_ {12} {\ Sigma_ {22}} ^ {-1}({\ boldsymbol a}-\ boldsymbol \ mu_2) および共分散行列 \ overline {\ Sigma} = \ Sigma_ {11}-\ Sigma_ {12} {\ Sigma_ {22}} ^ {-1} \ Sigma_ {21}

[Σ11Σ12Σ21Σ22]
(y1|y2=a)N(μ¯,Σ¯)
μ¯=μ1+Σ12Σ221(aμ2)
Σ¯=Σ11Σ12Σ221Σ21

実際、これらの結果はウィキペディアでも提供されていますが、μ¯およびΣ¯がどのように派生するかはわかりません。これらの結果は、カルマンフィルターを導出するための重要な統計式であるため、重要です。誰かがμ¯\ overline {\ Sigma}を派生させる派生ステップを提供してくれΣ¯ますか?どうもありがとうございました!


24
アイデアは、条件付き密度の定義を使用することです。ジョイントは2変量正規であり、周辺は正規ことがわかっているので、値を置き換えて不快な代数を実行するだけです。これらのメモは役に立つかもしれません。ここに完全な証拠があります。f(y1|y2=a)=fY1,Y2(y1,a)fY2(a)fY1,Y2fY2

1
2番目のリンクが質問に回答します(+1)。なぜ@Procrastinatorの答えにしないのですか?
gui11aume

1
気付いていませんでしたが、条件付きPCAでこの方程式を暗黙的に使用していたと思います。条件付きPCAは、変換が必要効果A.いくつかの選択肢を与え、条件付き共分散行列を算出している(IA(AA)1A)Σ
ジョン

@Procrastinator-実際のアプローチには、Woodburyマトリックスアイデンティティの知識と、ブロックごとのマトリックス反転の知識が必要です。これらは、不必要に複雑な行列代数をもたらします。
確率論的

2
@probabilityislogic実際、結果は私が提供したリンクで証明されています。しかし、他の方法よりも複雑であることがわかった場合、それは立派です。さらに、私はコメントで最適な解決策を提供しようとしていませんでした。また、私のコメントは、マクロの回答よりも前でした(ご覧のとおり、これを支持しました)。

回答:


111

コメントのProcrastinatorのリンク(+1)のように、ブルートフォースによって条件付き密度を明示的に計算することで、それを証明できます。しかし、多変量正規分布の条件付き分布はすべて正規であるという定理もあります。したがって、残っているのは、平均ベクトルと共分散行列を計算することだけです。大学の時系列クラスで、3番目の変数を巧妙に定義し、そのプロパティを使用して、リンクのブルートフォースソリューションよりも単純に結果を導出することにより、これを導出したことを覚えています(行列代数に慣れている限り)。私は記憶から行きますが、それはこのようなものでした:


ましょう最初のパーティションとすること秒。ここで定義します。ここで。今、私たちは書くことができますx1x2z=x1+Ax2A=Σ12Σ221

cov(z,x2)=cov(x1,x2)+cov(Ax2,x2)=Σ12+Avar(x2)=Σ12Σ12Σ221Σ22=0

したがって、とは無相関であり、これらは一緒に正常であるため、独立しています。さて、明らかに、したがってzx2E(z)=μ1+Aμ2

E(x1|x2)=E(zAx2|x2)=E(z|x2)E(Ax2|x2)=E(z)Ax2=μ1+A(μ2x2)=μ1+Σ12Σ221(x2μ2)

最初の部分を証明します。共分散行列については、

var(x1|x2)=var(zAx2|x2)=var(z|x2)+var(Ax2|x2)Acov(z,x2)cov(z,x2)A=var(z|x2)=var(z)

これでほぼ完了です。

var(x1|x2)=var(z)=var(x1+Ax2)=var(x1)+Avar(x2)A+Acov(x1,x2)+cov(x2,x1)A=Σ11+Σ12Σ221Σ22Σ221Σ212Σ12Σ221Σ21=Σ11+Σ12Σ221Σ212Σ12Σ221Σ21=Σ11Σ12Σ221Σ21

2番目の部分を証明します。

注:ここで使用される行列代数にあまり詳しくない人にとっては、これは優れたリソースです。

編集:ここで使用される1つの特性これはマトリックス料理(良いキャッチ@FlyingPig)ではないである共分散行列についてのWikipediaのページのプロパティ6である2つのランダムベクトルの、もちろんスカラーの場合、ただし、ベクトルの場合は、マトリックスの配置が異なる限り異なります。x,y

var(x+y)=var(x)+var(y)+cov(x,y)+cov(y,x)
cov(X,Y)=cov(Y,X)

この素晴らしい方法をありがとう!私には馴染みのない行列代数が1つありますが、を開くための式はどこにありますか?私はあなたが送ったリンクでそれを見つけていません。var(x1+Ax2)
空飛ぶ豚

@Flyingpig、どういたしまして。これは式結果であり、Matrix Cookbookに書かれていないランダムなベクトルの合計の分散の追加プロパティと組み合わせた結果だと思います-この事実を答えに加えました-キャッチしてくれてありがとうそれ!(291),(292)
マクロ

13
これは非常に良い回答(+1)ですが、アプローチの順序に関しては改善できます。、とは独立/無相関のベクトル全体の線形結合が必要だと言うことから始めます。これは、およびを意味するという事実を使用できるためです。これらは順におよび式につながります。これは、を使用する必要があることを意味します。ここでです。場合は可逆である私たちは、持っていますz=Cx=C1x1+C2x2x2p(z|x2)=p(z)var(z|x2)=var(z)E(z|x2)=E(z)var(C1x1|x2)E(C1x1|x2)C1=Icov(z,x2)=Σ12+C2Σ22=0Σ22C2=Σ12Σ221
確率的

1
@jakeoung-であることが証明されていないため、この値に設定されているため、知りたい変数を含む式を取得します。C1=I
確率論的

1
@jakeoung私もその声明をよく理解していません。私はこのように理解しています:場合、です。したがって、の値は何らかの形で任意のスケールです。したがって、簡単するためにを設定します。cov(z,x2)=0cov(C11z,x2)=C11cov(z,x2)=0C1C1=I
ケンT

6

マクロによる答えは素晴らしいですが、ここでは条件付き分布を主張する外部定理を使用する必要のない、さらに簡単な方法があります。これには、条件ステートメントの引数変数を分離する形式でマハナロビス距離を記述し、それに応じて標準密度を因数分解することが含まれます。


条件付きベクトルのマハナロビス距離の書き換え:この導出では、Schur補数 。最初にブロックワイズ反転式を使用して、逆分散行列を次のように記述します。ΣS=Σ11Σ12Σ221Σ21

Σ1=[Σ11Σ12Σ21Σ22]1=[Σ11Σ12Σ21Σ22],

どこ:

Σ11=ΣS1 Σ12=ΣS1Σ12Σ221,Σ21=Σ221Σ12ΣS1Σ22=Σ221Σ12ΣS1Σ12Σ221. 

この式を使用して、マハナロビス距離を次のように記述できます。

(yμ)TΣ1(yμ)=[y1μ1y2μ2]T[Σ11Σ12Σ21Σ22][y1μ1y2μ2]=(y1μ1)TΣ11(y1μ1)+(y1μ1)TΣ12(y2μ2)+(y2μ2)TΣ21(y1μ1)+(y2μ2)TΣ22(y2μ2)=(y1(μ1+Σ12Σ221(y2μ2)))TΣS1(y1(μ1+Σ12Σ221(y2μ2)))=(y1μ)TΣ1(y1μ),

どこ:

μμ1+Σ12Σ221(y2μ2),ΣΣ11Σ12Σ221Σ21.

この結果は、ランダムベクトルの正規性を仮定しない一般的な結果であることに注意してください。これは、マハナロビ距離を再構成する便利な方法を提供します。これにより、分解のベクトルのうちの1つのみ(2つは平均ベクトルと分散行列に吸収されます)に関して2次形式になります。


条件付き分布の導出:マハナロビス距離の上記の形式ができたので、残りは簡単です。我々は持っています:

p(y1|y2,μ,Σ)y1p(y1,y2|μ,Σ)=N(y|μ,Σ)y1exp(12(yμ)TΣ1(yμ))=exp(12(y1μ)TΣ1(y1μ))y1N(y1|μ,Σ).

これにより、指定された条件付き平均ベクトルと条件付き分散行列を使用して、条件付き分布も多変量正規分布であることが確立されます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.