ガウス尤度+どの事前=ガウス限界か?


8

サンプルについてガウス尤度を与え様とのパラメータ空間とされて、平均ベクトルと共分散行列の任意のパラメーター化。y

p(y|θ)=N(y;μ(θ),Σ(θ))
Θμ(θ)Σ(θ)

限界尤度なるように、事前密度と平均ベクトルおよび共分散行列パラメーター化を指定することは可能ですか?はガウス尤度ですか?p(θ)μ(θ)Σ(θ)

p(y)=θΘN(y;μ(θ),Σ(θ))p(θ)dθ

共分散がわかっている自明な解、つまりを除外すると思います。ここで、は任意の固定共分散行列ですが、これは不可能です。Σ(θ)=ΣΣ

特別な場合および、つまりは1次元であり、、ここでは、表示できる均一密度を示します: μ(σ2)=μΣ(σ2)=σ2yp(σ2)=U(σ2;a,b)U(σ2;a,b)

p(y)=0N(y;μ,σ2)U(σ2;a,b)dσ2=1baabN(y;μ,σ2)not a Gaussian density

受け入れられた回答には、公式または非公式の証明またはそれへのポインタが含まれています。

回答:


2

あなたの推測は真実のようです:一定の分散のみが通常のマージンにつながることができます。私の証明は、期待値が既知である場合に限定されているため、ゼロと見なすことができます。一般的なケースでは、機能分析からのより洗練された議論が必要と思われます。μ

問題は、法線の継続的な混合とベイズについてです。ここでは、法線の(連続的な)スケールの混合は、些細な混合に対してのみ正常である可能性があることがここで証明されました。

最初に、既知の平均と精度パラメーター次元法線の場合を考え ます。一般性を失うことなく、パラメータは精度自体であると想定できます。の周辺分布が正規の場合、乗法定数までの正規密度です。偶関数であるこの密度は、いくつかのといくつかの定数の場合、の形式を取る必要があり。これはどのにも当てはまるのでμ=0ω:=1/Σ>0θY EXP { - Y 2 ω / 2 }ωyY C のexp { - Y 2 ω 0 / 2 } ω 0 > 0 、C > 0 、Y S = Y 2 0 EXP { - S ωexp{y2ω/2}ω1/2p(ω)dωycexp{y2ω0/2}ω0>0c>0y我々はで取得すべて、密度関数の有限測度 は、でのディラックの質量に比例します。これは、これらの2つのメジャーが乗算定数まで同じラプラス変換を持つためです。したがって、はほぼ確実に(として)と等しくなります。 s:=y2 S 0 ω ω 1 / 2 P ω ω 0 ω ω 0

0exp{sω/2}ω1/2p(ω)dω=cexp{sω0/2}
s0ωω1/2p(ω)ω0ωω0

この証明は、平均ゼロと精度行列次元の法線に 拡張され ます。その後、マージンは書きます ここで、積分は正定対称セットあります行列。この積分は、同一である場合 、次にとることによりスカラー および任意のベクトルの場合)Ω = Σ - 1 α EXP { - Y ΩdΩ:=Σ1P D × D C のexp { - YΩ 0 、Y / 2 } Y= exp{yΩy/2}|Ω|1/2p(Ω)dΩPd×dcexp{yΩ0y/2}S 0 U U Ωy:=sus0u、上記のようにはと等しくなければならないことがわかります は、がと同じであることを示しています。証明は、密度ががルベーグメジャーゼロ のサブセットに集中している場合でも機能します。ラプラス変換引数が引き続き適用されるためです。したがって、証明は、精度(または分散)行列の一般的なパラメーター化に対して機能します。UΩ 0 U Ω Ω 0 | Ω | 1 / 2 P Ω PuΩuuΩ0uΩΩ0|Ω|1/2p(Ω)P


私はあなたの証拠を完全に理解していません。Jacky1の回答と比較すると、比較的複雑に見えます。彼の証明についてどう思いますか?
ジュリアンカール2016

さて、ジャッキーの答えで、事前分布がどのようにに依存できるか理解できませんでした。しかし、私が理解している彼の発言は間違っています-私は最初に同じエラーを実行しました:)実際、は必ずしも一定ではなく、分散が一定の場合、は正常であり、正方形を完成させることで簡単に確認できます。私は今、独立した以前のケース(簡単にするために1次元)の証拠を持っています。多分新しい答えとして、すぐに書き留めたいと思います。分散は定数でなければならず、は正常(おそらく退化)でなければなりません。μ μ Σ μyμμΣμ
イヴ

あなたは「これは任意のために保持しているためで始まる段落にあなたの推論を展開することができとで終わる」(よう)に等しい?たぶん、あなたが使用している定理へのポインタと」yω0
ジュリアンKarls

1

仮定とアプリオリに独立しているとことを 平均で通常の余裕があると分散。次に、分散が一定でなければならず、平均が通常の事前を持っている必要があることを証明します(おそらく退化しています)。Σ Y μ 0 Σ 0 Σ μμΣyμ0Σ0Σμ

特性関数(cf)、つまりを使用して、簡単にするために1次元のケースに固執します。我々は知っていると同様の式の分布のために保持}を条件 と仮定によって正常です。したがって、任意の実数 そして、積分を再配置することにより、 φ YT = E [ E Y I T ] φ YT = EXP { μ 0 I T - Σ 0 T 2 / 2 Y μ Σ T E [ E Y I T ] = E [ E Y I トンyϕy(t):=E[eyit]ϕy(t)=exp{μ0itΣ0t2/2yμΣt EXP { μ 0 I T - Σ 0 T 2 / 2 } = [ EXP { μ I T } P μ

E[eyit]=E[eyit|μ,Σ]p(μ)p(Σ)dμdΣ=exp{μitΣt2/2}p(μ)p(Σ)dμdΣ,
exp{μ0itΣ0t2/2}=[exp{μit}p(μ)dμ][exp{Σt2/2}p(Σ)dΣ].
このような再配置に必要な仮定は簡単に確認できます。

右側の最初の積分、たとえばは cfです 。なお、以降実数であることが判明した、我々が見るの配布ことである対称WRT、ひいてはその 、予想通りだったかもしれません。μ φ 1T E - μ 0 I T μ μ 0 E [ μ ] = μ 0ϕ1(t)μϕ1(t)eμ0itμμ0E[μ]=μ0

これで、右側の2番目の積分、たとえば もcfであることがわかります。これを確認するには、であることを確認する必要がありが連続であり、また、関数 は正定(pd)です。最初の要件は明らかであり、2番目の要件は収束の支配によって証明されます。今PD要件に向ける:事前分布は、として書かれている場合 ディラック質量であり、その後あるため、PDである次に、正規分布のCFです。事前がディラック質量の離散混合である場合、これはφ 20 = 1 φ 2、T = 0 φ 2 P Σ D Σ φ 2 φ 2 φ 2 φ 2ϕ2(t)ϕ2(0)=1ϕ2t=0ϕ2p(Σ)dΣϕ2ϕ2ϕ2次に、法線の混合のcfです。連続性の引数から、はpd であることがわかりますϕ2

今、私たちは、強力な使いましょうレヴィ・クラマーの定理告げるその両方の機能ための、形取る必要がありますと現実と。したがって、 は平均値で正常(おそらく退化)でなければなりません。単純な代数によって、 は任意の実数を保持します。非負の実際の書き込みは 2/2であるため、事前変換のラプラス変換はϕjj=12exp{ajitbjt2/2}ajbj0μa1=μ0

exp{(Σ0b1)t2/2}=0exp{Σt2/2}p(Σ)dΣ
tt2/2Σにあるディラックの質量のそれと等しくなければなりません。Σ0b1

お疲れ様でした。これを理解するには少し時間がかかります。
ジュリアンカール、

0

証明の命題がありますが、確認する必要があります。

周辺尤度がガウスであると仮定します。

p(y)=N(y,m,Γ)

次に、事前密度は次のように定義できます。

p(θ)=N(y,μ(θ),Σ(θ))1N(y,m,Γ)f(θ)

ここで、はおよびをチェックしてます。(は)。fθΘf(θ)dθ=1f(θ)0θΘf(θ)p(θ|y)

密度であることが、前密度の積分で、言い換えれば1に等しくなければなりませんp(θ)Θ

θΘN(y,μ(θ),Σ(θ))1N(y,m,Γ)f(θ)dθ=1です。

につながる

θΘN(y,μ(θ),Σ(θ))1N(y,m,Γ)f(θ)dθ=θΘf(θ)dθ

この等式は、および場合にのみ真になります。μ(θ)=mΣ(θ)=Γ


2
私は証明のアイデアが好きです。私は最後のステップを除くすべてのステップが有効であることを確信しています。関数が同じであれば、2つの関数の積分は同じですが、これは必須条件ではありません。そこで別の定理を使用していますか?
ジュリアンカール

あなたが交換した場合のためのあなたの最初の式におけるベイズ経由してそのdefintionと、それはなっ。確かに、この不平等から来るものは何もない。p θ p θ = p θ p(θ|y)p(θ)p(θ)=p(θ)
ジュリアンカール
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.