iid実数値確率変数の合計に対するベイズ推定


8

ましょう、、...、 IID RVの範囲となるが、未知の分布。(必要に応じて、配信が継続的であると仮定しても構いません。)X1X2Xn[0,1]

定義します。Sn=X1++Xn

私はS_kを与えられSk、尋ねます:S_nについてベイジアンの方法で何を推測でき Snますか?

つまり、RVのサイズkのサンプルの合計が与えられ、ベイジアンアプローチを使用して、すべてのRVの合計の分布について何を推測できるかを知りたいのです(そして、分布)。

サポートが[0,1]ではなく\ {0,1 \}である場合、この問題は十分に研究されており、(事前分布が均一であれば)S_nの推定分布のベータ二項複合分布が得られます。しかし、[0,1]を範囲としてどのようにアプローチするのかわかりません...{0,1}[0,1]Sn[0,1]

完全な開示:私はすでにこれをMathOverflowに投稿しましたが、ここに投稿した方がいいと言われたので、これは再投稿です。


MOであなたにコメントを書こうとしていましたが、代わりにここに書きます。質問がこのフォーラムにより適していると思われる場合は、MOにフラグを付けて、クローズするよう依頼することができます。
枢機卿、

1
あなたの最後の声明の説明をお願いします。範囲が場合、の分布でにない値に質量を置く分布は愚かなように見えるので、あなたの目的を正しく理解しました。(たぶん参照が役に立つでしょう。){0,1}{0,1,,n}Sk
枢機卿

私は何を誤解しましたか?
枢機卿

1
ベイジアンのノンパラメトリックに興味がありますか?の分布を仮定したくない場合は、Xkの場合、ノンパラメトリックフレームワークが必要です。しかし、その後、Skあなたは多くを言うことはできません...
西安

1
これらは良い発言です。問題が少し混乱したことを残念に思います。と比較してnは非常に大きいと思っていましたk、そしてその事後 Snパラメータの事後を直接反映します。おそらくの代わりにSn 私は使うべきだった Sn=Sn/n、後部を求めた limSn無限大になります。これは今意味がありますか?n
ロナルドLリベスト

回答:


2

次のベイズノンパラメトリック分析を考えてみましょう。

定義する X=[0,1] そしてましょう B ボレルのサブセットである X。しましょうα ゼロ以外の有限測定であること (X,B)

しましょう Q パラメータ付きのディリクレ過程であること α、そして X1,,Xn 条件付きでiidである Q=q、 そのような μX1(B)=P{X1B}=q(B)、 すべてのための BB

ディリクレ過程の特性から、 X1,,Xk、のような将来の観測の予測分布 Xk+1 メジャーです β 以上 (X,B) によって定義されます

β(B)=1α(X)+k(α(B)+i=1kIB(Xi)).

今、定義します Fk によって生成されたシグマ場として X1,,Xk、測定可能性との対称性を使用します Xi取得する

E[SnFk]=Sk+E[i=k+1nXi|Fk]=Sk+(nk)E[Xk+1Fk],
ほぼ間違いなく。

明確な答えを見つけるために、 α()/α(X) です U[0,1]。定義c=α(X)>0、 我々は持っています

E[SnX1=x1,,Xk=xk]=sk+nkc+k(c2+sk),
ほぼ確実に [μX1,,Xk] (の共同配布 X1,,Xk)、 どこ sk=x1++xk。「有益ではない」限界c0、以前の期待は、 n(sk/k)、つまり、この場合、事後推定は Sn ただ n 最初の平均の倍 k 可能な限り直感的に見える観察。

素敵な表現を得ることが可能ですか Var[Sn|Sk]このモデルでも?
シアン

1

以下の測定理論の欠如と表記法の乱用を許してください...

これはベイジアン推論であるため、問題の未知数に関する事前知識が必要です。この場合は、 X1、上の一連の分布の値を取る無限次元パラメーター [0,1] (あれを呼べ π)。データ配信Sk|π 正規分布に収束するので、 k十分に大きい(Berry-Esseenの定理)ので、近似値としてその法線をたたくことができます。さらに、近似が正確である場合、以前の唯一の側面p(π) 実際的に重要なのは (Eπ(X1),Varπ(X1))=(μ,σ2)

次に、標準のベイズ予測を行い、おおよその密度を入力します。(Sn と同じ近似が適用されます Sk。)

p(Sn|Sk)=p(π|Sk)p(Sn|π,Sk)dπ

p(Sn|Sk)=p(π)p(Sk|π)p(Sk)p(Sn|π,Sk)dπ

p(Sn|Sk)p(μ,σ2)N(Sk|kμ,kσ2)N(Sn|(nk)μ+Sk,(nk)σ2)d(μ,σ2)p(μ,σ2)N(Sk|kμ,kσ2)d(μ,σ2)

For the limits of the integral, μ[0,1], obviously; I think σ2[0,14]?

Added later: no, σ2[0,μ(1μ)]. This is nice -- the allowed values of σ2 depend on μ, so info in the data about μ is relevant to σ2 too.


1
I don't understand your main paragraph. First of all, the convergence to a normal is only after a shift and rescale of Sn and this is not by the Berry--Esseen theorem (which is a theorem on the convergence rate to normal), but the CLT. Furthermore, the shift and rescale will depend on the particular fixed parameter. Have you looked at a case where you have, say, a three point prior uniformly distributed on {0,1/2,1}?
cardinal

Let me clarify that when I write "normal" I don't mean standard normal. So the shift and re-scale change the mean and variance but the convergence is still to some element in the family of normal distributions. I meant for the link to the Berry-Esseen theorem to reference the phrase "if k is large enough"; its current placement is a cut-n-paste error, and I'll change it. I don't understand your question about the fixed parameter -- can you clarify the question?
Cyan

Re: cardinal's question. Note that the prior is a distribution on distributions with support in [0,1]. If I take your question literally, you're asking about a prior that has support on three constant random variables, which is trivial to analyze. But since you wrote in another comment "If the range is 0,1 then any distribution that puts any mass on values not in 0,1,,n for the distribution of Sk seems silly," I think you're asking discrete data distributions. The short answer is, "no, it's not silly." Continued...
Cyan


I think there are several issues here: (a) The question statement could use some refinement to clarify the end goal, (b) the question, comments and answers have, unfortunately, been muddled through inadvertent typos, calculation errors and multiple threads of conversation, and (c) my comments referenced above appear taken a little out of context. My statement regarding Sk (Typo: should have been Sn) concerns the posterior distribution of Sn given Sk. If I know Sn{Sk,,n} then any posterior distribution which does not put all its mass there should be inadmissible.
cardinal

0

Let each Xi belong to distribution family F and have parameters θ.

Given, Sk, we have a distribution on θ:

Pr(θSk)=1ZPr(θ)Pr(Skθ)

And, our distribution on Sn, nk is

Pr(Sn=iSk)=Pr(Snk=iSk|Sk)=Pr(Snk=iSk|θ)Pr(θSk)dθ

(and similarly for n<k)

Both of these equations have nice forms when F is a distribution in the exponential family that is closed under summation of iid elements like the normal distribution, the gamma distribution, and the binomial distribution. It also works for their special cases like the exponential distribution and the Bernoulli distribution.

It might be interesting to consider F is the family of scaled (by 1n) binomial distributions with known "trials" n, and taking the limit as n goes to infinity.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.