「サンプリング理論」の人々は、そのような推定値は存在しないと言うでしょう。しかし、あなたはそれを得ることができます、あなたはあなたの前の情報について合理的である必要があり、はるかに難しい数学的な仕事をします。
ベイズ推定法を指定し、事後が前と同じである場合、データはパラメーターについて何も言わないと言うことができます。物事が「特異」になる場合があるため、無限のパラメータ空間を使用することはできません。ピアソン相関を使用しているため、2変量の正規尤度があると仮定しています。
ここで、
QI=(XI-μX)2
p(D|μx,μy,σx,σy,ρ)=(σxσy2π(1−ρ2)−−−−−−−−√)−Nexp(−∑iQi2(1−ρ2))
Qi=(xi−μx)2σ2x+(yi−μy)2σ2y−2ρ(xi−μx)(yi−μy)σxσy
ここで、1つのデータセットが同じ値である可能性があることを示すために、と記述します。yi=y
ここで
、S2、X=1
∑iQi=N[(y−μy)2σ2y+s2x+(x¯¯¯−μx)2σ2x−2ρ(x¯¯¯−μx)(y−μy)σxσy]
s2x=1N∑i(xi−x¯¯¯)2
あなたの可能性は、4つの数に依存ように、。あなたはの見積もりたいので、ρを、あなたの前で乗算する必要がある、と迷惑なパラメータアウト統合するので、μ のx、μ yの、σ のx、σ yと。統合の準備をするために、「正方形を完成させる」
∑ i Q is2x,y,x¯¯¯,Nρμx,μy,σx,σy
∑iQi1−ρ2=N⎡⎣⎢⎢(μy−[y−(x¯¯¯−μx)ρσyσx])2σ2y(1−ρ2)+s2xσ2x(1−ρ2)+(x¯¯¯−μx)2σ2x⎤⎦⎥⎥
ここで、注意を怠って適切に正規化された確率を確保する必要があります。そうすれば、トラブルに巻き込まれることはありません。そのようなオプションの1つは、それぞれの範囲に制限を設けるだけの、情報量の少ない事前分布を使用することです。我々が持っているので、フラット前やと手段のためにL σ < σ のx、σ yの < U σ前ジェフリーズと標準偏差のために。これらの制限は、問題について考える少しの「常識」で簡単に設定できます。ρに対して不特定の事前確率をとりますLμ<μx,μy<UμLσ<σx,σy<Uσρ、そして、我々は得る(ユニフォームは問題なく動作するはずであり、特異点を切り捨てない場合):±1
p(ρ,μx,μy,σx,σy)=p(ρ)Aσxσy
ここで、。これにより、次のものが得られます。A=2(Uμ−Lμ)2[log(Uσ)−log(Lσ)]2
p(ρ|D)=∫p(ρ,μx,μy,σx,σy)p(D|μx,μy,σx,σy,ρ)dμydμxdσxdσy
=p(ρ)A[2π(1−ρ2)]N2∫UσLσ∫UσLσ(σxσy)−N−1exp(−Ns2x2σ2x(1−ρ2))×
∫UμLμexp(−N(x¯¯¯−μx)22σ2x)∫UμLμexp⎛⎝⎜⎜−N(μy−[y−(x¯¯¯−μx)ρσyσx])22σ2y(1−ρ2)⎞⎠⎟⎟dμydμxdσxdσy
Now the first integration over μy can be done by making a change of variables z=N−−√μy−[y−(x¯¯¯−μx)ρσyσx]σy1−ρ2√⟹dz=N√σy1−ρ2√dμy and the first integral over μy becomes:
σy2π(1−ρ2)−−−−−−−−√N−−√⎡⎣⎢Φ⎛⎝⎜Uμ−[y−(x¯¯¯−μx)ρσyσx]σyN√1−ρ2−−−−−√⎞⎠⎟−Φ⎛⎝⎜Lμ−[y−(x¯¯¯−μx)ρσyσx]σyN√1−ρ2−−−−−√⎞⎠⎟⎤⎦⎥
And you can see from here, no analytic solutions are possible. However, it is also worthwhile to note that the value ρ has not dropped out of the equations. This means that the data and prior information still have something to say about the true correlation. If the data said nothing about the correlation, then we would be simply left with p(ρ) as the only function of ρ in these equations.
It also shows how that passing to the limit of infinite bounds for μy "throws away" some of the information about ρ, which is contained in the complicated looking normal CDF function Φ(.). Now if you have a lot of data, then passing to the limit is fine, you don't loose much, but if you have very scarce information, such as in your case - it is important keep every scrap you have. It means ugly maths, but this example is not too hard to do numerically. So we can evaluate the integrated likelihood for ρ at values of say −0.99,−0.98,…,0.98,0.99 fairly easily. Just replace the integrals by summations over a small enough intervals - so you have a triple summation