2つのガウス分布の加重混合の分散とは何ですか?


39

平均およびと分散および 2つの正規分布AおよびBがあるとします。私は重み使用して、これらの二つの分布の重み付き混合物を取りたいとと。この混合の平均はます。μ B σ A σ B P qは0 P 1 、Q = 1 - P μ A B = P × μ A+ Q × μ BμAμBσAσBpq0p1q=1pμAB=(p×μA)+(q×μB)

分散はどうなりますか?


具体的な例は、男性と女性の身長の分布のパラメーターを知っていた場合です。男性が60%の人の部屋がある場合、部屋全体の予想平均身長を算出できますが、分散はどうでしょうか。


用語について:混合物には単純に平均値と分散があります。とがランダム変数と見なされることをおそらく示唆していない限り、これらを「期待される」と見なす意味はありません。qpq
whuber

2つのガウス分布の混合が識別可能であることを知っています。しかし、2つのディストリビューションのエマンが同じ場合はどうでしょうか?つまり、同じ平均値と異なる標準偏差を持つ2つの正規分布の混合は識別可能ですか?この文脈で論文がありますか?事前に感謝

1
同様の質問と回答(COVARIANCESにも対処)があります:math.stackexchange.com/q/195911/96547
hplieninger

回答:


63

分散は2番目のモーメントから1番目のモーメントの2乗を引いたものであるため、混合のモーメントを計算するだけで十分です。

一般に、PDFおよび定数(非ランダム)重み分布が与えられた場合、混合物のPDFは次のようになります。p ifipi

f(x)=ipifi(x),

そこからは、任意の瞬間のためにすぐに次のことk

μ(k)=Ef[xk]=ipiEfi[xk]=ipiμi(k).

私は書かれているのためのモーメントと のためのモーメント。 K T Hと Fのμ K iは K T H F Iμ(k)kthfμi(k)kthfi

これらの式を使用して、分散を書くことができます

Var(f)=μ(2)(μ(1))2=ipiμi(2)(ipiμi(1))2.

分散場合等価、として与えられる、次に、混合物の分散を、その成分の分散と平均に関して次のように記述することができます。σ 2 I μ 2 私は = σ 2 I + μ 1 iは 2、Ffiσi2μi(2)=σi2+(μi(1))2f

Var(f)=ipi(σi2+(μi(1))2)(ipiμi(1))2=ipiσi2+ipi(μi(1))2(ipiμi(1))2.

言い換えれば、これは、(加重)平均分散に平均二乗平均マイナス平均平均の二乗を加えたものです。二乗は凸関数であるため、Jensenの不等式は、平均二乗平均が平均二乗以上になることを主張しています。これは、私たちは述べた式を理解することができ、混合物の分散は分散の混合物であるプラス手段の(加重)の分散を占める非負用語。

あなたの場合、分散は

pAσA2+pBσB2+[pAμA2+pBμB2(pAμA+pBμB)2].

これは、2つの分散加重混合であると解釈できます。さらに、混合平均全体に対する個々の平均からのシフトを説明するための(必然的に正の)補正項を解釈できます。pAσA2+pBσB2

質問で与えられたようなデータの解釈におけるこの分散の有用性は、混合分布が正規ではないため(そして、二峰性を示す程度まで実質的にそこから逸脱する可能性があるため)疑わしいです。


8
特に、であることに注意すると、最後の式は。σ 2 = μ 2 - μ 2 = P A σ 2 A + P B σ 2 B + P A 、P Bμ A - μ B 2pA+pB=1σ2=μ(2)μ2=pAσA2+pBσB2+pApB(μAμB)2
イルマリカロネン

2
または、我々はイベントがある(混合密度を確率的説明を課す行う場合 probabiityのおよび条件付きの密度所与である一方、条件付きの密度所与は)、varは条件付き分散の平均と条件付き平均の分散の合計です。後者は、値が確率がおよび離散RVです。ApAXAN(μA,σA2)XAc=BN(μB,σB2)(X)YμA,μBpq角括弧で囲まれた式はとすぐに認識されます。E[Y2](E[Y])2
ディリップサーワテ

1
@Neodyme定義によれば、分散は2次モーメントから平均2乗を引いたものです。したがって、2番目の瞬間は分散平均二乗を加えたものです。
whuber

1
@Neodymeはます。E(X)=μ
whuber

1
@Kiran混合物が正常に見える場合もありますが、そうではありません。これを確認する1つの方法は、ここで与えられた式を使用して過剰な尖度を計算することです。すべての標準偏差が等しくない限り、ゼロではありません。この場合、「混合物」はそもそも実際には混合物ではありません。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.