回答:
非公式の治療
ランダム変数を条件とする表記は不正確ですが、経済的ではありますが表記として不正確であることを覚えておく必要があります。実際には、これらのランダム変数が生成するシグマ代数を条件としています。つまり、を意味するように意図されたE [ Y | σ (X )]。このコメントは「非公式の扱い」では場違いに見えるかもしれませんが、条件エンティティはセットのコレクションであることを思い出させます(そして、単一の値を条件とする場合、これはシングルトンセットです)。そして、これらのセットには何が含まれていますか?情報が含まれていますランダム変数の可能な値は、Yの実現で何が起こるかについて私たちに提供します。
情報の概念を取り入れることで、反復的な期待の法則(「タワープロパティ」と呼ばれることもある)を非常に直感的な方法で考える(使用する)ことができます
。2つのランダム変数によって生成されるシグマ代数は、少なくとも一個のランダム変数によって生成されるような大σ (X )⊆ σ (X 、Z )適切な集合論的意味で。だから、情報についてYが中に含まれるσ (X 、
は σ (X )の対応する情報と少なくとも同じくらい大きいです。
今、表記ほのめかしとして、セット σ (X )≡ I X及び σ (X 、Z )≡ I X 、Z。次に、私たちが見ている方程式のLHSを書くことができます
上記の表現を口頭で説明します:「利用可能な情報 I xのみがある場合、{情報 I x zが与えられた Yの期待値}の期待は?」
どういうわけか「考慮する」ことができますか?いいえ- 私はxしか知りません。しかし、(解決したい表現によって義務付けられているように)持っているものを使用する場合、基本的に期待演算子の下でYについて物事を言っています。つまり、「E (Y ∣ I x)」と言います。情報を使い果たしました。
したがって、
他の誰かがそうしない場合、私は正式な治療のために戻ります。
A(もう少し)正式な治療
確率理論の2つの非常に重要な本、P。ビリングスリーの確率と測定(3d ed.-1995)およびD.ウィリアムズ「Probability with Martingales」(1991)が、「反復期待法則」を証明する問題をどのように扱うかを見てみましょう。
ビリングスリーは、証拠に正確に3行を費やしています。ウィリアムズ、私は引用します、と言います
「(タワープロパティ)は、条件付き期待値の定義から事実上即時です」。
これは1行のテキストです。ビリングスリーの証明は、それほど不透明ではありません。
当然です:条件付き期待のこの重要で非常に直感的なプロパティは、その定義から本質的に直接(そしてほぼ即座に)派生します-唯一の問題は、この定義は通常、確率の外側で教えられていないか、少なくとも強調されていないことですまたは理論円を測定します。ただし、(ほぼ)3行で反復期待値の法則が成り立つことを示すために、条件付き期待値の定義、またはむしろその定義プロパティが必要です。
確率空間と積分可能な確率変数Yを考えます。してみましょうGは、サブもσ -代数のF、G ⊆ F。そこ関数存在WであるG、-measurableを積分であり(これは、定義特性です)
ここで、は集合Gのインジケーター関数です。私たちは、と言うWは、(「バージョン」)の条件付き期待であるY与えられたG、と私たちは書き込み
W = E (Y | G)
ここで注意すべき重要な詳細は、との条件付き期待が、同じ期待値を有することである Yは、全体にわたりだけではなく、ない G、しかし、すべてのサブセット内の Gの G。
(Towerプロパティが条件付き期待値の定義からどのように派生するかを提示しようとします)。
は Gで測定可能なランダム変数です。いくつかのサブそして、考えてみましょ σ -代数、言う H ⊆ Gを。次いで、 G ∈ H ⇒ G ∈ G。したがって、以前と同様の方法で、 Hが与えられた場合の Wの条件付き期待値があります。たとえば、 U = E (W ∣ H)それが特徴です
以来、、式[ 1 ]及び[ 2 ]私たちを与えます
しかし、これはHが与えられたの条件付き期待値の定義プロパティです。したがって、U = E (Y ∣ H)と書く権利があります。U = E (W ∣ H)= E ( E [ Y ∣ G ] ∣ H )
も構築しているため、タワープロパティ、または反復期待値の法則の一般的な形式を8行で証明しました。
条件付き期待を理解し、生徒に教える方法は次のとおりです。
条件付き期待値は、解像度σ (X )でカメラで撮影された写真です。
Alecos Papadopoulosが述べたように、表記法はE [ Y | X ]。カメラのラインに沿って、Yを元のオブジェクト、たとえば風景、風景などと考えることができます。E [ Y | σ (X 、Z )]は、解像度σ (X 、Z )でカメラで撮影された写真です。期待値は平均化演算子です(「ぼやけ」演算子?)。シーンには多くのものが含まれている可能性がありますが、低解像度のカメラを使用して撮影した写真は、確かにいくつかの詳細が消えてしまいます。たとえば、空にUFOがあり、肉眼で見ることができますが、 (iphone 3?)が撮影した写真に表示されます
ように解像度が非常に高い場合、この写真は実際の風景のあらゆる詳細をキャプチャできます。この場合、E [ Y | σ (Y )] = Y。
今、は、次のように表示できます。解像度σ (X )(たとえば、iphone 1)がσ (X 、Z )(たとえば、iphone 3)よりも低い別のカメラを使用し、解像度を有するカメラσ (X 、Z )、それはことは明らかです写真上のこの写真は、もともと風景で低解像度カメラを使用している場合と同じである必要があります。
これにより、。実際、この同じ直観から、E [ E [ Y | X ] | X 、Z ] = E [ Y | X ]まだ。これは、最初の写真がiphone 1(低解像度)で撮影され、より良いカメラ(iphone 3など)を使用して最初の写真に別の写真を生成したい場合、方法がありません。最初の写真の品質を改善できます。
反復期待の法則(LIE)、では、その内部期待は偶然Xの関数であるランダム変数であり、例えばg (X )ではなくYの関数。Xのこの関数への期待がYの期待に等しくなることは、LIEの結果です。これはすべて、手を振って、Yの平均値は平均化によって見つけることができるという主張にすぎません。さまざまな条件下でのの平均値。実際には、それはすべて総確率の法則の直接的な結果です。たとえば、XとYが、ジョイントpmf p X 、Y(x 、y )を持つ離散確率変数である場合、 E [ Y ] 、最後の期待値がXに関するものであることに注意してください。E[Y∣X]はXではなくYの関数ですが、それでもその平均はYの平均と同じです。