Halmos-Savage定理の直感的な理解


12

Halmos-サベージ定理が優勢統計モデルのことを言うΩ AP(Ω,A,P)統計量T Ω APΩ 'A 'T:(Ω,A,P)(Ω,A)で十分であるすべてのための(及び場合のみ)であれば{ P P }{PP}が存在するTTラドンNikodym誘導体の-measurableバージョンのD PがDのPは、*dPdPここで、DP*はdP、特権尺度であるように、Pは*=Σはiは= 1 PICIをP=i=1PiciするためのCI>0Σはiが= 1、Ciは=1ci>0,i=1ci=1PIPをPiP

定理が真である理由を直感的に把握しようとしましたが、成功しませんでしたので、定理を理解する直感的な方法があるかどうかが私の質問です。


ここに正しいリンクがあると思います。間違えた場合はチェックして削除してください。
GUNG -復活モニカ

4
たぶん、用語で読者を助ける、例えば、「支配的な統計モデル」、「TT可測性」、「特権的手段」を定義するか?
カール

回答:


6

技術補題

これがどれほど直感的かはわかりませんが、ハルモス・サベージの定理の声明の根底にある主な技術的結果は次のとおりです。

補題。 してみましょうμがμ可能σσ上-finite対策S A(S,A)。仮定しℵが上の措置の集まりであるS A(S,A)など、すべてのためのことをν νν « μνμ。次いで、非負数のシーケンスが存在する{ C I } iは= 1{ci}i=1の要素と配列ℵを{ ν I } iは= 1{νi}i=1ようΣは私は= 1、C iの = 1i=1ci=1ν « Σ I = 1 C I νをνi=1ciνiごとに1つずつν ν

これは、シェルビッシュの統計理論(1995)の定理A.78から逐語的に取られています。その中で、彼はそれをリーマンの統計統計仮説検定(1986)(第3版へのリンク)に帰し、その結果はHalmosとSavage自身に帰せられます(補題7を参照)。別の参考資料として、Shaoの数学統計(2003年第2版)があります。関連する結果は補題2.1と定理2.2です。

上記の補題は、σσ有限メジャーによって支配されるメジャーのファミリーで開始する場合、実際には、ファミリー内からメジャーのカウント可能な凸の組み合わせで支配メジャーを置き換えることができると述べています。シェルビッシュは、定理A.78を述べる前に、

「統計アプリケーションでは、多くの場合、単一のσσ有限メジャーに関して絶対に連続するメジャーのクラスがあります。単一の支配メジャーが元のクラスにあるか、またはクラス。次の定理はこの問題に対処します。」

具体例

未知のθ > 0に対して区間[ 0 θ ]に均一に分布すると考えられる量XのX測定を行うと仮定します。この統計問題では、[ 0 θ ]の形式のすべての区間の均一分布からなるR上のボレル確率測度の集合Pを暗黙的に考慮しています。場合、あるλ示しルベーグ測度と、のためのθ > 0P θ表すユニフォーム[[0,θ]θ>0PR[0,θ]λθ>0Pθ 0θ ] Uniform([0,θ])分布(すなわち、 P θA = 1θ λA[0θ]=A1θ 1[0θ]XD X

Pθ(A)=1θλ(A[0,θ])=A1θ1[0,θ](x)dx
すべてのボレルのために A RAR)、我々は単に持って P = { Pのθをθ > 0 }
P={Pθ:θ>0}.
これは、測定値 XのX候補分布のセットです。

家族PはP明らかルベーグ測度によって支配されるλλ(あるσσ(と上記補題ので、-finite)= Pが=P)配列の存在を保証{ C I } iは= 1{ci}i=1非負に合計数の11及びAをシーケンス{ Q 、I } iは= 1{Qi}i=1で一様分布のPはPそのようなこと P θ « Σ I = 1 C I Q I

Pθi=1ciQi
θ > 0に対してθ>0。この例では、このようなシーケンスを明示的に構築できます!

まず、聞かせてθ I 私は= 1が(θi)i=1正の有理数の列挙(もこれは明示的に行うことができます)、および聞かせてQを私は = Pがθ IをQi=PθiIi。次は、聞かせてcをiは = 2 - Ici=2i、だからΣはiは= 1、C iは = 1i=1ci=1。私はこの組み合わせと主張{ C iは} iは= 1{ci}i=1および{ Qを Iを}i=1{Qi}i=1 works.

To see this, fix θ>0θ>0 and let AA be a Borel subset of RR such that i=1ciQi(A)=0i=1ciQi(A)=0. We need to show that Pθ(A)=0Pθ(A)=0. Since i=1ciQi(A)=0i=1ciQi(A)=0 and each summand is non-negative, it follows that ciQi(A)=0ciQi(A)=0 for each ii. Moreover, since each cici is positive, it follows that Qi(A)=0Qi(A)=0 for each ii. That is, for all ii we have Qi(A)=Pθi(A)=1θiλ(A[0,θi])=0.

Qi(A)=Pθi(A)=1θiλ(A[0,θi])=0.
Since each θiθi is positive, it follows that λ(A[0,θi])=0λ(A[0,θi])=0 for each ii.

Now choose a subsequence {θik}k=1{θik}k=1 of {θi}i=1{θi}i=1 which converges to θθ from above (this can be done since QQ is dense in RR). Then A[0,θθik]A[0,θ]A[0,θθik]A[0,θ] as kk, so by continuity of measure we conclude that λ(A[0,θ])=limkλ(A[0,θik])=0,

λ(A[0,θ])=limkλ(A[0,θik])=0,
and so Pθ(A)=0Pθ(A)=0. This proves the claim.

Thus, in this example we were able to explicitly construct a countable convex combination of probability measures from our dominated family which still dominates the entire family. The Lemma above guarantees that this can be done for any dominated family (at least as long as the dominating measure is σ-finite).

The Halmos-Savage Theorem

So now on to the Halmos-Savage Theorem (for which I will use slightly different notation than in the question due to personal preference). Given the Halmos-Savage Theorem, the Fisher-Neyman factorization theorem is just one application of the Doob-Dynkin lemma and the chain rule for Radon-Nikodym derivatives away!

Halmos-Savage Theorem. Let (X,B,P) be a dominated statistical model (meaning that P is a set of probability measures on B and there is a σ-finite measure μ on B such that Pμ for all PP). Let T:(X,B)(T,C) be a measurable function, where (T,C) is a standard Borel space. Then the following are equivalent:

  1. T is sufficient for P (meaning that there is a probability kernel r:B×T[0,1] such that r(B,T) is a version of P(BT) for all BB and PP).
  2. There exists a sequence {ci}i=1 of nonnegative numbers such that i=1ci=1 and a sequence {Pi}i=1 of probability measures in P such that PP for all PP, where P=i=1ciPi, and for each PP there exists a T-measurable version of dP/dP.

Proof. By the lemma above, we may immediately replace μ by P=i=1ciPi for some sequence {ci}i=1 of nonnegative numbers such that i=1ci=1 and a sequence {Pi}i=1 of probability measures in P.

(1. implies 2.) Suppose T is sufficient. Then we must show that there are T-measurable versions of dP/dP for all PP. Let r be the probability kernel in the statement of the theorem. For each Aσ(T) and BB we have P(AB)=i=1ciPi(AB)=i=1ciAPi(BT)dPi=i=1ciAr(B,T)dPi=Ar(B,T)dP.

Thus r(B,T) is a version of P(BT) for all BB.

For each PP, let fP denote a version of the Radon-Nikodym derivative dP/dP on the measurable space (X,σ(T)) (so in particular fP is T-measurable). Then for all BB and PP we have P(B)=XP(BT)dP=Xr(B,T)dP=Xr(B,T)fPdP=XP(BT)fPdP=XEP[1BfPT]dP=BfPdP.

Thus in fact fP is a T-measurable version of dP/dP on (X,B). This proves that the first condition of the theorem implies the second.

(2. implies 1.) Suppose one can choose a T-measurable version fP of dP/dP for each PP. For each BB, let r(B,t) denote a particular version of P(BT=t) (e.g., r(B,t) is a function such that r(B,T) is a version of P(BT)). Since (T,C) is a standard Borel space, we may choose r in a way that makes it a probability kernel (see, e.g., Theorem B.32 in Schervish's Theory of Statistics (1995)). We will show that r(B,T) is a version of P(BT) for any PP and any BB. Thus, let Aσ(T) and BB be given. Then for all PP we have P(AB)=A1BfPdP=AEP[1BfPT]dP=AP(BT)fPdP=Ar(B,T)fPdP=Ar(B,T)dP.

This shows that r(B,T) is a version of P(BT) for any PP and any BB, and the proof is done.

Summary. The important technical result underlying the Halmos-Savage theorem as presented here is the fact that a dominated family of probability measures is actually dominated by a countable convex combination of probability measures from that family. Given that result, the rest of the Halmos-Savage theorem is mostly just manipulations with basic properties of Radon-Nikodym derivatives and conditional expectations.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.