一様分布のパラメータの推定:不適切な事前?


10

我々は、N個のサンプルを有する、一様分布からここで不明です。データからを推定します。Xi[0,θ]θθ

ベイズの法則...

f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)

そして可能性は:

0XIθIf(Xi|θ)=i=1N1θ (edit:when for all、0 for -thanks whuber)0Xiθi

に関する他の情報がないため、事前分布は(つまり均一)または(Jeffreys事前?)に比例しているように見えが、私の積分は収束せず、どうすればよいかわかりません。何か案は?θ11L[0,]


2
あなたの可能性は正しくありません:が最大のより小さいときは常にゼロになります。X IθXi
whuber

あなたが取っている積分を示すことができますか?

ええ、だから、私は前の不適切なことに対処する方法を知らないだけだと思います。例えば、私が欲しいの書き込みにf[Xi]=Θf(Xi|θ)f(θ)dθ
ウィル

1
不適切な事前場合、 = =および以前の場合、同様にのでほぼ確実に、積分が収束する一定です。f[Xi]=Θf(Xi|θ)f(θ)dθmax(Xi)θNdθmax(Xi)1N/(N1)f(θ)1/θmax(Xi)N/N.maxXi>0
whuber

1
ベルナルド参照事後はパレートです- 非情報事前分布カタログを参照してください。
ステファン・ローラン

回答:


4

これは興味深い議論を引き起こしましたが、関心のある問題にそれほど大きな違いをもたらさないことに注意してください。個人的には、はスケールパラメータであるため、変換グループの引数が適切であり、θ

p(θ|I)=θ1log(UL)θ1L<θ<U

この分布は、問題の再スケーリングの下で​​も同じ形をしています(再スケーリングの下で​​も、可能性は「不変」のままです)。この事前分布のカーネルであるは、関数方程式解くことによって導出できます。の値は問題によって異なり、サンプルサイズが非常に小さい(1や2など)場合にのみ問題になります。後部は切り捨てられたパレートです。f(y)=y1af(ay)=f(y)L,U

p(θ|DI)=NθN1(L)NUNL<θ<UwhereL=max(L,X(N))
ここで、はN番目です注文統計、またはサンプルの最大値。の事後平均を取得します 我々場合セットと我々は簡単exressionの取得。X(N)
E(θ|DI)=N((L)1NU1N)(N1)((L)NUN)=NN1L(1[LU]N11[LU]N)
UL0E(θ|DI)=NN1X(N)

しかし、ここで、によって与えられるより一般的な事前分布を使用するとしますすべてが適切であることを確認するために限界を維持することに注意してください-特異な数学はありません) )。後部は、次いで、上記と同じであるが、とによって置換 -ただし、。上記の計算を繰り返すと、単純化された事後平均p(θ|cI)θc1L,UNc+Nc+N0

E(θ|DI)=N+cN+c1X(N)

したがって、一様事前分布()は、推定値を提供しますただし、(場合、平均は無限大))。これは、ここでの議論が、分散推定の除数としてまたはを使用するかどうかに少し似ていることを示しています。c=1N1N2X(N)N2N=2NN1

この場合の事前の不適切なユニフォームの使用に対する1つの議論は、場合、後方は比例するため、事後は不適切であるということです。しかし、これはまたは非常に小さい場合にのみ重要です。N=1θ1N=1


1

ここでの目的は、おそらく有効で有用な推定値を取得することであるため、事前分布、サンプルの母集団の分布の仕様と一致している必要があります。これは、サンプル自体を使用して事前に「計算」するという意味では決してありません。これにより、手順全体の有効性が無効になります。サンプルの元となる母集団は、それぞれが範囲にあるiid一様確率変数の母集団であることはわかっています。これは維持された仮定であり、私たちが持っている以前の情報の一部です(そして、サンプルとは関係ありません。つまり、これらの確率変数のサブセットの特定の実現とは関係ありません)。θ[0,θ]

ここで、この母集団が確率変数で構成されると仮定します(サンプルは確率変数の実現で構成されています)。維持された仮定は、 mn<mn

maxi=1,...,n{Xi}maxj=1,...,m{Xj}θ

コンパクトさを表す。次に、があり、と書くこともできます。 maxi=1,...,n{Xi}XθX

θ=cXc1

密度関数の均一RVの範囲内のIIDで maxN[0,θ]

fX(x)=N(x)N1θN

サポート、その他の場所ではゼロ。次に、を使用して変数変更式を適用することにより、維持された仮定と一致する事前分布を取得します [0,θ]θ=cXθ

fp(θ)=N(θc)N1θN1c=NcNθ1θ[x,]

定数適切に指定しないと、これは不適切になる場合があります。しかし、私たちの関心を適切持つにある後部のための、そしてまた、我々は可能な値を制限したくない(維持仮定によって暗黙の制限を超えました)。したがって、未定のままにし。 次に、書くと、事後はcθθc
X={x1,..,xn}

f(θX)θNNcNθ1f(θX)=ANcNθ(N+1)

いくつかの正規化定数Aが必要です。

Sθf(θX)dθ=1xANcNθ(N+1)dθ=1

ANcN1NθN|x=1A=(cx)N

後部への挿入

f(θX)=(cx)NNcNθ(N+1)=N(x)Nθ(N+1)

事前分布の未定定数は都合よく相殺されていることに注意してください。c

事後は、特定のサンプルが値に関して提供できるすべての情報を要約しています。特定の値を取得する場合は、事後の期待値 θθ

E(θX)=xθN(x)Nθ(N+1)dθ=NN1(x)NθN+1|x=NN1x

この結果に直感はありますか?数だけでなく、の増加、より多くの可能性が、その中で最大の実現が近いと近い彼らの上限になることである -の事後平均値を正確に何である反映:たとえば、もし、、ただし場合。これは、以前の選択に関する私たちの戦術は合理的であり、目前の問題と一致していたが、ある意味で必ずしも「最適」ではなかったことを示しています。XθθN=2E(θX)=2xN=10E(θX)=109x


1
データに基づいて事前計算を行うことは、私にはうさんくさいようです。このアプローチをどのように正当化しますか?
whuber

2
私はあなたの先例が「最高」ではないという事実に対して何もしません。どこでそんなこと言ったの?私はあなたのアプローチを理解しようとしています。私はこの平等をまだ理解していません。が等式で一定の場合、それはと両方がランダムでないことを意味しますか ちなみに、以前の導出でを使用していないということですか。(CCの@whuber)cθ=cXXθc1
ステファンローラン

1
そして、あなたの以前のサポートはデータに依存しますか?()θ[x,[
ステファン・ローラン

3
データに依存している場合でも(これがサポートのみである場合でも)、誤って聞こえますサンプルが生成される前のサンプルの最大値を知ることはできません。さらに、はほぼ確実であり、と両方がランダムであると主張します(したがって、相関)。しかし、これは事後分布(サンプルが与えられた条件付き分布)がでのディラック質量であることを意味します。そして、これは、事後分布の導出と矛盾します。...(文字が残っていません...)θ=cXθX1θθcx
StéphaneLaurent 2013

1
事後分布でディラックある手段 IS。ベイズの定理は原因ではありません。仮定してすべてを破壊します。これは意味するため、が指定された条件付き分布はでのディラック質量ですが、元の仮定では、この分布は。θcxθ cxθ=cXX=θ/cXθθ/c(0,θ)
ステファン・ローラン

0

均一事前分布定理(間隔の場合):

「データ外部にあるに関するあなたの情報の全体が単一の命題 場合、論理的に内部的に一貫性のある以前の仕様は、 θD

B={{Possible values for θ}={the interval (a,b)},a<b}
f(θ)=Uniform(a,b)

したがって、上記の定理を本当に信じるなら、以前の仕様はジェフリーの事前仕様に対応しているはずです。」

均一事前分布定理の一部ではありません:

または、事前分布をパレート分布(ユニフォームの共役分布として指定することもできます。これは、事後分布が共役によって別の一様分布でなければならないことを知っているためです。ただし、パレート分布を使用する場合は、何らかの方法でパレート分布のパラメーターを指定する必要があります。f(θ)


4
最初に、「論理的に一貫性のある唯一可能な答え」は一様分布であると言い、次に代替案を提案します。それは非論理的で一貫性がないように思えます:-)。
whuber

2
同意できません。たとえば、はセットでもありますのPDFあるのため。しかし、「定理」によれば、その間隔でpdfがであるです。つまり、命題は問題がどのようにパラメーター化されるかに依存しませんが、「定理」の結論はパラメーター化に依存します。B{θ|θ3(a3,b3)}.ΘUniform(a,b),Ψ=Θ31/(3ψ2/3(ba))a3<ψ<b3ΨUniform(a3,b3)1/(b3a3)
whuber

2
BabakP:これが定理であるとどうして言えるでしょうか?定理は、数学的証明を備えた数学的主張です。この「定理」は「原則」としてより適切に呼ばれますが、@ whuberで示されているように、矛盾しているので賢明ではありません。
ステファン・ローラン

2
参照BabakPをありがとう。「証明スケッチ」は偽物であることを指摘したいと思います。Draperは、間隔を等間隔の有限数の値に分割し、「限界に達する」。誰でも、間隔を間隔を空けた値に分割して、お好みの密度に近づけ、同様に限界に到達させることで、完全に恣意的な「論理的に内部的に一貫性のある以前の仕様のみ」を生成できます。この種のもの-つまり、非ベイジアンが非論理的であることを示すために悪い数学を使用して-ベイジアン分析に(予想外に)悪い名前を与えます。(cc @Stéphane。)
whuber

1
@Stéphane私の無関心さ(insensibilité)を許してください-私はここで第2言語でやり取りするあなたのスキルを高く評価しており、あいまいな用語を意図的に使用していません! 偽のは、お金を偽造するためにマシンを参照する200年前の米国のスラング用語から来ている形容詞です。この場合、それは定理を偽造するための数学的な機械です:-)。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.