2つの正規分布変数の混合が、それらの平均が一般的な標準偏差の少なくとも2倍異なる場合に、二峰性のみになるのはなぜですか?


28

2つの正規分布が混在する場合:

https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions

「2つの正規分布の混合には、推定する5つのパラメーターがあります。2つの平均、2つの分散、および混合パラメーター。標準偏差が等しい2つの正規分布の混合は、平均が標準偏差の少なくとも2 」

これが本当である理由についての派生物または直観的な説明を探しています。私はそれが2サンプルのt検定の形で説明できるかもしれないと信じています:

μ1μ2σp

ここで、はプールされた標準偏差です。σp


1
直観は、平均が近すぎる場合、2つの密度の質量の重なりが大きくなりすぎて、2つの質量の差で差が生じるため、平均の差が見られないということです。密度。2つの平均が十分に異なる場合、2つの密度の質量はそれほど重ならず、平均の差は認識できます。しかし、私はこれの数学的な証拠を見たいです。それは興味深いステートメントです。私は前に見たことがない。
mlofton

2
より正式には、同じSD持つ2つの正規分布の50:50混合物に対して、パラメーターを示す完全な形式で密度をと、平均間の距離が未満から上に増加すると、2番目の微分は2つの平均の中間点で符号が変化することを確認してください。F X = 0.5 gで1X + 0.5 gで2X 2 σσ,f(x)=0.5g1(x)+0.5g2(x)2σ
BruceET

回答:


53

そのwiki記事にリンクされている論文のこの図は、素晴らしい説明を提供します。 ここに画像の説明を入力してください

彼らが提供する証拠は、正規分布がその平均の1 SD内で凹であるという事実に基づいています(SDは、凹から凸に向かう正規pdfの変曲点です)。したがって、2つの通常のpdfを(等しい比率で)加算すると、それらの平均の差が2 SD未満である限り、sum-pdf(つまり、混合)は2つの平均間の領域で凹になります。グローバルな最大値は、2つの平均値の間の正確なポイントになければなりません。

参照:Schilling、MF、Watkins、AE、およびWatkins、W.(2002)。人間の身長は二峰性ですか?アメリカの統計学者、 56(3)、223–229。土井:10.1198 / 00031300265


11
+1これは素晴らしい、思い出に残る議論です。
whuber

2
図のキャプションは、「fl」の合字が「inflection」で誤ってレンダリングされていることを示しています。
P– nekomatic

2
@Axeman:その参照を追加してくれてありがとう-これは少し爆発したので、私はそれを自分で追加することを計画していました、私は本当に彼らの議論を繰り返しているので、私はそれについてあまり信用しすぎたくないので。
ルーベンファンベルゲン

14

この結果は通常の混合物の特別な特性であるため、これは写真がだまされる可能性があります:成分が対称的な単峰性分布であっても、アナログは他の混合物には必ずしも当てはまりません!たとえば、2つのスチューデントのt分布が、標準偏差の2倍弱離れて等しい混合である場合、二峰性になります。実際の洞察を得るには、数学を行うか、正規分布の特別な特性にアピールする必要があります。


測定単位を選択し(必要に応じて再センタリングおよび再スケーリングすることにより)、コンポーネント分布の平均を共通の分散を統一します。ましょう混合物中のより大きな平均成分の量です。これにより、混合密度を完全に一般的に表現できます。±μ, μ0,p, 0<p<1,

2πf(x;μ,p)=pexp((xμ)22)+(1p)exp((x+μ)22).

両方の成分の密度はどこ高めるためどこ低減唯一の可能なモードが発生に対してを 微分し、ゼロに設定することでそれらを見つけます。取得した正の係数をクリアするx<μx>μ,μxμ.fx

0=e2xμp(xμ)+(1p)(x+μ).

fe2xμ

f(x;μ,p)(1+x2μ2)xμ.

μ<x<μ,f(1μ2+x2).μ1,μ1

2μ,

正規分布の混合は、平均が標準偏差の2倍以下である場合は常に単峰性です。

これは、問題のステートメントと論理的に同等です。


12

連続性のためにここに貼り付けた上記のコメント

f(x)=0.5g1(x)+0.5g2(x)

コメントの続き:

σ=1.3σ,2σ,σ,

ここに画像の説明を入力してください

図のRコード:

par(mfrow=c(1,3))
  curve(dnorm(x, 0, 1)+dnorm(x,3,1), -3, 7, col="green3", 
    lwd=2,n=1001, ylab="PDF", main="3 SD: Dip")
  curve(dnorm(x, .5, 1)+dnorm(x,2.5,1), -4, 7, col="orange", 
    lwd=2, n=1001,ylab="PDF", main="2 SD: Flat")
  curve(dnorm(x, 1, 1)+dnorm(x,2,1), -4, 7, col="violet", 
    lwd=2, n=1001, ylab="PDF", main="1 SD: Peak")
par(mfrow=c(1,3))

1
すべての答えは素晴らしかった。ありがとう。
mlofton

3
2/30.001.

1
0.1% fx0)
f(x0)f(x)0.001f(x0)  |xx0|0.333433,
0.0010.95832
f(x0)f(x)0.001  |xx0|0.47916.

良い点。実際、短縮された言語「フラット」が意味するのは、ちょうど中間点でゼロの2次導関数でした。
ブルースET
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.