結合分布がガウスではないガウス確率変数のペアを持つことは可能ですか?


91

就職の面接で誰かが私にこの質問をしましたが、彼らの共同分布は常にガウス分布であると答えました。私はいつでも平均と分散と共分散を持つ二変量ガウスを書くことができると思いました。2つのガウス分布の結合確率がガウス分布ではない場合がありますか?


4
ウィキペディアの別の例。もちろん、変数が独立で、わずかにガウスであれば、それらは共同でガウスです。

回答:


138

二変量正規分布は例外であり、規則ではありません!

正規の周辺を持つ「ほぼすべての」結合分布、二変量正規分布ではないことを認識することが重要です。つまり、2変量正規分布ではない正規の周辺分布を持つ結合分布は、何らかの形で「病理学的」であるという一般的な視点は、少し見当違いです。

確かに、多変量法線は線形変換の下での安定性のために非常に重要であり、そのためアプリケーションで大きな注目を集めています。

いくつかの例から始めると便利です。次の図には、6つの2変量分布のヒートマップが含まれています。すべての分布には標準の正規分布があります。一番上の行の左と中央のものは二変量法線であり、残りのものはそうではありません(明らかなはずです)。以下でさらに説明します。

標準正規周辺の二変量分布の例。

コピュラの裸の骨

依存関係のプロパティは、多くの場合、コピュラを使用して効率的に分析されます。二変量コピュラは、単位正方形上の確率分布のためだけ空想名前であるで均一な周辺分布。[0,1]2

仮定二変量コピュラです。次に、上記からすぐに、たとえば、およびであることがわかります。C(u,v)C(u,v)0C(u,1)=uC(1,v)=v

2変量コピュラの単純な変換により、事前に指定された周辺を持つユークリッド平面で2変量ランダム変数を構築できます。ましょうと確率変数のペアのための周辺分布を規定する。次に、が2変量コピュラの場合、 は周辺および 2変量分布関数です。この最後の事実を見るには、 同じ引数がます。F 2X Y C u v F x y = C F 1x F 2y F 1 F 2F1F2(X,Y)C(u,v)

F(x,y)=C(F1(x),F2(y))
F1F2
P(Xx)=P(Xx,Y<)=C(F1(x),F2())=C(F1(x),1)=F1(x).
F2

と連続している場合、Sklarの定理は、一意性を意味する逆を主張します。つまり、連続的な周辺、持つ2変量分布が与えられた場合、対応するコピュラは一意です(適切な範囲空間上)。F1F2F(x,y)F1F2

二変量正規は例外的です

Sklarの定理は、(本質的に)2変量正規分布を生成するコピュラが1つしかないことを示しています。これは、適切な名前であり、ガウス・コピュラに密度を有している ここで分子は、および評価された相関持つ二変量正規分布です。。[0,1]2

cρ(u,v):=2uvCρ(u,v)=φ2,ρ(Φ1(u),Φ1(v))φ(Φ1(u))φ(Φ1(v)),
ρΦ1(u)Φ1(v)

しかし、他のコピュラがたくさんあり、それらはすべて前のセクションで説明した変換を使用することにより、2変量正規分布ではない正規の周辺を持つ2変量分布を与えます。

例の詳細

場合ことに注意してください AMである任意の濃度とコピュラ変換の下で標準正規周辺分布と、対応する二変量密度は C(u,v)c(u,v)F(x,y)=C(Φ(x),Φ(y))

f(x,y)=φ(x)φ(y)c(Φ(x),Φ(y)).

上記の方程式でガウスコピュラを適用すると、2変量正規密度が復元されることに注意してください。しかし、他の選択については、そうしません。c(u,v)

図の例は、次のように構成されています(各行を一度に1列ずつ移動します)。

  1. 独立成分を持つ二変量正規分布。
  2. 変量正規分布。ρ=0.4
  3. この回答に与えられた例ディリップSarwate。密度のコピュラによって誘発されることが容易に。C(u,v)c(u,v)=2(1(0u1/2,0v1/2)+1(1/2<u1,1/2<v1))
  4. パラメーターのフランクコピュラから生成されます。θ=2
  5. パラメーターのClaytonコピュラから生成されます。θ=1
  6. パラメーター Claytonコピュラの非対称修正から生成されます。θ=3

7
+1は、2変量正規密度が例外的なケースであるという発言についてです!
ディリップサルワテ

多分何かが足りないかもしれませんが、から開始すると、共同分布は、コピュラの構築とは無関係に自動的に定義され、 CDFへのガウスコピュラの構築、非ガウスCDFを取得することは事実ですが、この関数は一般に開始したランダム変数ペアのCDFではありません。?X1,X2N(0,1)(X1,X2)F(x1,x2)X,X2
RandomGuy

右下のパネルのようにシミュレートする方法の例: library(copula) kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE))) # force normal margins evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1))) contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
半パス

1
@RandomGuy、という明示されていない仮定がありません。もしそれらが独立していると仮定すれば、そうです、あなたはすでに共同分布を知っています。独立性の仮定がなければ、周辺分布を知ることは、共同分布を特定するのに十分な情報を与えません。X1,X2independentN(0,1)
MentatOfDune

25

多変量正規ベクトルの各要素自体が正規分布していることは事実であり、その平均と分散を推定できます。ただし、2つのGuassian確率変数が一緒に正規分布しているというのは事実ではありません。以下に例を示します。

編集:点質量であるランダム変数は正規分布変数と考えることができるというコンセンサスに応えて、例を変更しています。σ2=0


ましょおよびletである確率変数。つまり、それぞれが確率です。XN(0,1)Y=X(2B1)BBernoulli(1/2)Y=±X1/2

最初に、に標準正規分布があることを示します。Y全確率の法則により、

P(Yy)=12(P(Yy|B=1)+P(Yy|B=0))

次、

P(Yy|B=0)=P(Xy)=1P(Xy)=1Φ(y)=Φ(y)

どこを標準正規CDFです。同様に、Φ

P(Yy|B=1)=P(Xy)=Φ(y)

したがって、

P(Yy)=12(Φ(y)+Φ(y))=Φ(y)

したがって、のCDF はであるため、です。YΦ()YN(0,1)

ここで、が一緒に正規分布していないことを示します。X,Y@cardinalが指摘しているように、多変量正規の特徴の1つは、その要素のすべての線形結合が正規分布していることです。はこのプロパティはありません。X,Y

Y+X={2Xif B=10if B=0.

したがって、は確率変数と0の点質量の混合物であるため、正規分布できません。Y+X50/50N(0,4)


4
私はこの答えに同意しません。縮退質点で通常ゼロ分散を有する縮重ガウス確率変数であると考えられます。また、はわずかに連続していますが、連続して連続していません。わずかにガウスであるが結合してガウスではない2つの結合した連続確率変数の例については、たとえば、この回答の後半を参照してください。1μ(X,X)
ディリップサルワテ

4
@DilipSarwate、問題は、正規分布しているがそれらの共同分布が多変量正規分布ではない2つの変数の例(存在する場合)を与えることでした。これは一例です。正規分布のほとんどの標準定義(例:wikipedia en.wikipedia.org/wiki/Normal_distribution)では、分散が厳密に正である必要があります。したがって、正規分布のファミリーの一部として点質量は含まれません。
マクロ

4
多変量ガウス分布の標準的な特徴は、がすべてガウス分布である場合に限り、が多変量ガウス分布であるということです。@Dilipが示唆するように、これがあなたの例に当てはまるかどうかを検討する価値があります。XRnaTXaRn
枢機

6
あなたは明らかに合理性への訴えが好きではないので;-)、権威への訴えはどうですか?(それが明白でない場合、それは冗談です。)私は何か他のものを探していたときに偶然に偶然これに偶然に遭遇しました:例2.4、GAF Seberの22ページ、AJ Lee、線形回帰分析、2番目。ed。、Wiley。「とput ...したがって、には多変量正規分布があります。」YN(μ,σ2)Y=(Y,Y)Y
枢機

5
議論は定義についてです。明らかに、定義による共分散行列が非特異的なマクロである必要がある場合、例を提供しますが、これは@cardinalが参照するより自由な定義による例ではありません。より自由な定義を好む理由の1つは、正規変数のすべての線形変換が正規であることです。特に、正規誤差を伴う線形回帰では、残差は共分散正規分布を持ちますが、共分散行列は特異です。
NRH

5

次の投稿には、主なアイデアを示して開始するために、証明の概要が含まれています。

ましょう二つの独立したガウス確率変数であるとletである z=(Z1,Z2)x=(X1,X2)

x=(X1X2)=(α11Z1+α12Z2α21Z1+α22Z2)=(α11α12α21α22)(Z1Z2)=Az.

各ですが、これらは両方とも同じ独立したr.vsの線形結合であるため、一緒に依存しています。XiN(μi,σi2)

定義 r.vsのペアは、独立した正規のr.vs線形結合として記述できる場合、2変量正規分布と呼ばれます。x=(X1,X2)x=Azz=(Z1,Z2)

補題 場合二変量ガウス分布である場合、それらの任意の他の線形組み合わせが再び正規確率変数です。x=(X1,X2)

証明。些細なことで、誰にも怒らないようにスキップされました。

プロパティ 場合は無相関である、それらは独立しており、その逆。X1,X2

配布X1|X2

想定前けれどものは、彼らが正の分散を有する、ゼロを簡単にするために意味と仮定してみましょうと同じガウスr.vsあります。X1,X2

がにまたがる部分空間の場合、および。SX2X1S=ρσX1σX2X2X1S=X1X1S

X1とは線形結合なので、も線形結合です。それらは、ガウス型であり、無相関(証明)で独立しています。X2zX2,X1S

分解 は、

X1=X1S+X1S
E[X1|X2]=ρσX1σX2X2=X1S

V[X1|X2]=V[X1S]=E[X1ρσX1σX2X2]2=(1ρ)2σX12.

次に

X1|X2N(X1S,(1ρ)2σX12).

2つの単変量ガウス確率変数は、条件式ともガウスです。X,YX|YY|X


2
この観察がどのように質問に答えているかは明らかではありません。製品ルールは実際には条件付き分布の定義であるため、双正規分布に特別なものではありません。後続のステートメント "then in order ..."には理由がありません。条件付き分布も正規でなければならないのはなぜですか?
whuber

whuber、私は主な質問に答えています:「2つのガウス分布の結合確率がガウス分布ではない場合があるのだろうか?」したがって、答えは次のとおりです。条件が正常でない場合。-補助的
補助的

2
そのデモンストレーションを完了できますか?今のところ、それはあなたの側の単なる主張であり、証拠はありません。それが正しいことはまったく明らかではありません。また、存在を確立する必要があるため、不完全です。つまり、少なくとも1つの条件が非正規であるが、共同分布が正規の周辺を持つことが実際に可能であることを実証する必要があります。事実、これは些細なことです。なぜなら、メジャー0のセットの従法線の各条件付き分布は、その限界を変更することなく自由に変更できるからです。
whuber

こんにちは@whuber、これがもっと役立つことを願っています。提案や編集はありますか?あまり暇がないので、私はこれを非常に迅速に書きました:-)が、あなたができる提案や改善を評価します。ベスト
補助的

(1)何を証明しようとしていますか?(2)質問は、ガウス周辺の分布が共同ガウス分布ではないときを尋ねるので、この議論がどのように関連することにつながるかわかりません。
whuberの
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.