なぜ確率空間を定義するためにシグマ代数が必要なのですか?


122

サンプル空間形成するさまざまな結果を使用したランダムな実験があり、イベントと呼ばれる特定のパターンに興味を持って調べますシグマ代数(またはシグマフィールド)は、確率測定を割り当てることができるイベントで構成されています。nullセットとサンプル空間全体の包含、ベン図表との結合と交点を記述する代数など、特定のプロパティが満たされています。 Ω,FP F. P

確率は、代数と区間間の関数として定義されます。全体で、トリプルは確率空間を形成しますσ[0,1](Ω,F,P)

誰かが代数を持っていなかった場合に確率構造が崩壊する理由を簡単な英語で説明できますか?それらは、その書道「F」がありえないほど真ん中に押し込まれています。それらが必要だと信じています。イベントは結果とは異なることがわかりますが、\ sigma-代数がなければ何がおかしくなりますか?σσ

問題は、どのタイプの確率問題において、σ代数を含む確率空間の定義が必要になるかです。


ダートマス大学のWebサイトにあるこのオンラインドキュメントは、わかりやすい英語の説明を提供します。アイデアは、単位周囲の円上で反時計回りに回転する回転ポインターです。

ここに画像の説明を入力してください

まず、図に示すように、単位円の円とポインターで構成されるスピナーを作成します。円上の点を選択してにラベルを付け、次に、円上の他のすべての点に、から反時計回りに測定した距離(など)のラベルを付けます。実験では、ポインターを回転させ、ポインターの先端にあるポイントのラベルを記録します。ランダム変数にこの結果の値を示します。サンプル空間は明らかに間隔0x0X[0,1)。各結果が等しく発生する可能性がある確率モデルを構築したいと思います。可能性のある結果の数が限られている実験で[...]のように進めた場合、可能性のある結果のすべてについて確率の合計がそうでないため、確率を各結果に割り当てる必要があります等しい1(実際、数え切れない数の実数を合計するのは難しい仕事です;特に、そのような合計が何らかの意味を持つためには、せいぜい数え切れないほどの被加数の多くがと異なる場合があり。)割り当てられた確率の全ては、その後、合計があり、 ではなくそれがあるべきように、。00001

したがって、各ポイントに確率を割り当て、(数え切れないほど)無限の数のポイントがあるとすると、それらの合計はます。>1


9
程度の回答を求めて自滅思わ測度論に言及していない-fields!σ
西安

5
私はそうしました...あなたのコメントを理解しているかわかりません。
アントニ・パレラダ16年

8
確かに、シグマフィールドの必要性は単なる意見の問題ではありません...これはここで(私の意見では)トピックで検討できると思います。
グン

8
確率論の必要性が「頭」と「尾」に限定されている場合は、明らかに -fieldsの必要はありません!σ
西安

26
これはいい質問だと思います。教科書では、確率トリプルへの完全に不要な参照が頻繁に見られますが、著者はその後、完全に無視します。(Ω,F,P)
dsaxton

回答:


124

西安の最初のポイント: -algebras について話しているときは、測定可能なセットについて尋ねているので、残念ながらすべての答えは測定理論に焦点を合わせなければなりません。ただし、そっとそれを構築しようとします。σ

数えられない集合のすべてのサブセットを認める確率の理論は数学を破る

この例を考えてみましょう。あなたが単位正方形があると、あなたがランダムに単位正方形内の特定のセットのメンバである点を選択する確率に興味を持っています。多くの状況では、これは異なるセットの領域の比較に基づいて容易に回答できます。たとえば、いくつかの円を描いてその面積を測定し、その円に収まる正方形の割合として確率を取ることができます。とても簡単です。R2

しかし、対象セットの領域が明確に定義されていない場合はどうでしょうか?

エリアが明確に定義されていない場合、エリアが何であるかについて2つの異なるが完全に有効な(何らかの意味で)結論を推論できます。だから我々は持っている可能性が一方とを意味一方、。これにより、数学のすべてが修復不可能になります。これで、および他の多くの馬鹿げたことを証明できます。明らかに、これはあまり便利ではありません。P A = 0 0 = 1 5 < 0P(A)=1P(A)=00=15<0

σ -algebrasは数学を修正するパッチです

何です正確には、 -代数?それは実際には恐ろしいことではありません。これは、どのセットをイベントと見なすことができるかの定義にすぎません。ない要素には、定義された確率尺度がありません。基本的に、代数は、数学の病理学的な動作、つまり測定不可能な集合を回避できる「パッチ」です。F σσFσ

-field の3つの要件は、確率で何をしたいのかという結果と考えることができます。 -fieldは、3つのプロパティを持つセットです。σσσ

  1. 可算組合の下での閉鎖。
  2. 可算交差点の下での閉鎖。
  3. 補完の下で閉鎖。

可算ユニオンと可算インターセクションのコンポーネントは、測定不可能なセットの問題の直接的な結果です。補数の下での閉包はコルモゴロフ公理の結果です場合、はます。しかし、(3)がないと、が未定義になる可能性があります。それは奇妙だろう。補数のもとでの閉包とコルモゴロフの公理により、ようなことが言えます。P(A)=2/3P(Ac)1/3P(Ac)P(AAc)=P(A)+1P(A)=1

最後に、に関連するイベントを検討しているため、ΩΩF

朗報:代数は不可算集合に対してのみ厳密に必要ですσ

しかし!ここにも良いニュースがあります。または、少なくとも、問題を回避する方法。数え切れないカーディナリティを持つセットで作業している場合にのみ、 -algebras が必要です。我々は可算集合に自分自身を制限している場合、我々は取ることができますパワーのセット、我々は理由可算のためにこれらのいずれかの問題がありません、のみで構成さ測定可能なセットの。(これは西安の2番目のコメントで暗示されています。)教科書の中には実際に微妙な手品をコミットするものがあり、確率空間について議論するときは可算集合のみを考慮することに気付くでしょう。σF=2ΩΩΩ2Ω

さらに、幾何学的問題では、メジャーが定義されているセットで構成される代数のみを考慮するだけで十分です。これをもう少ししっかりと固定するために、は、長さ、面積、体積の通常の概念に対応します。したがって、前の例で私が言っているのは、幾何学的確率を割り当てるには、セットに明確に定義された領域が必要であるということです。そして、理由はこれです:測定不可能なセットを認めると、何らかの証拠に基づいて確率1をイベントに割り当て、他の証拠に基づいて同じイベントイベントに確率0を割り当てることができます。RnσLnLnn=1,2,3

ただし、数え切れないセットへの接続が混乱を招かないようにしてください!代数は可算集合であるという一般的な誤解。実際、それらは数えられるかもしれないし、数えられないかもしれない。この図を考えてみましょう。前と同じように、単位正方形があります。定義されたすべてに対して辺の長さを持ち、 1つの角を持つ正方形を描くことができます。この正方形が単位正方形のサブセットであることは明らかです。さらに、これらの正方形はすべて面積が定義されているため、これらの正方形は要素です。しかし、数え切れないほど多くの正方形があることも明確でなければなりませんσ

F=All subsets of the unit square with defined L2 measure.
Bss(0,1)(0,0)FB:そのような正方形の数は数えられず、各正方形はルベーグ測度を定義しています。

したがって、実際問題として、単純にその観察を行うだけで、ルベーグ測定可能なセットのみを考慮して問題の問題に対処できるという観察を行うのに十分です。

しかし、待って、測定不可能なセットは何ですか?

私自身、これについて少しだけ光を当てることができるのではないかと心配しています。しかし、Banach-Tarskiパラドックス(「太陽とエンドウ豆」のパラドックス)は、私たちを助けることができます。

3次元空間でソリッドボールが与えられると、ボールが有限数の互いに素なサブセットに分解され、元のボールの2つの同一のコピーを生成するために異なる方法で元に戻すことができます。実際、再組み立てプロセスでは、形状を変えずに、部品を動かして回転させるだけです。ただし、ピース自体は通常の意味での「ソリッド」ではなく、点の無限の散乱です。再構成は、わずか5個で実行できます。

定理のより強い形式は、2つの「合理的な」固体オブジェクト(小さなボールと巨大なボールなど)があれば、どちらか一方を他方に再構成できることを意味します。これは、「エンドウ豆を細かく切り刻んで太陽に戻すことができる」と非公式に述べられ、「エンドウ豆と太陽のパラドックス」と呼ばれます。1

したがって、確率で作業していて、幾何学的確率測定(体積の比率)を使用している場合、何らかのイベントの確率を計算する必要があります。ただし、ボリュームの変更のためにスペースのセットを再配置できるため、その確率を正確に定義するのに苦労します。確率がボリュームに依存し、セットのボリュームを太陽のサイズまたはエンドウ豆のサイズに変更できる場合、確率も変化します。そのため、イベントに単一の確率が割り当てられることはありません。さらに悪いことに、あなたは、並べ替えることができますの音量ような持っている幾何学的確率測度が確率報告することを意味し、R3SΩSV(S)>V(Ω)P(S)>1、確率が測定値1であることを必要とするコルモゴロフ公理の重大な違反において。

このパラドックスを解決するには、次の4つの譲歩のいずれかを行うことができます。

  1. セットの音量は、回転すると変化する場合があります。
  2. 2つの互いに素な集合の和集合の体積は、それらの体積の合計とは異なる場合があります。
  3. Zermelo–Fraenkelの公理は、選択公理(ZFC)を含む理論を変更する必要があるかもしれません。
  4. 一部のセットは「測定不能」とタグ付けされている場合があり、そのボリュームについて話す前にセットが「測定可能」かどうかを確認する必要があります。

オプション(1)は、確率の定義の使用に役立ちません。オプション(2)は2番目のコルモゴロフ公理に違反するため、外に出ます。オプション(3)は、ZFCが作成するよりも多くの問題を修正するため、ひどいアイデアのようです。しかし、オプション(4)は魅力的なようです。測定可能なものと測定できないものの理論を開発すれば、この問題に明確に定義された確率があります。これにより、測定理論と友人である代数に戻ります。σ


5
ご回答ありがとうございます。は測定可能なレベスクを表しますか?信仰に関するあなたの答えを+1しますが、数学のレベルを数ノッチ下げることができれば本当に感謝しています...:L
アントニ・パレラダ

7
(+1)良い点!また、メジャーと代数なしでは、ボレル-コルモゴロフパラドックスが示すように、数えられない空間での条件付き分布の条件付けと導出は非常に毛深いものになると付け加えます。σ
西安

2
@ Xi'an優しい言葉をありがとう!それは本当にあなたから来るたくさんのことを意味します。この記事の執筆時点では、ボレル・コルモゴロフのパラドックスについては詳しくありませんでしたが、いくつかの読書を行い、調査結果を有効に追加できるかどうかを確認します。
-Sycorax

3
@ Student001:ここで髪を分割していると思います。「メジャー」(任意のメジャー)の一般的な定義がシグマ代数の概念を使用して与えられるのは正しいです。しかし、私のポイントは、私の最初のリンクで提供されているルベーグ測度の定義に「シグマ代数」という言葉や概念がないことです。言い換えれば、ルベーグ測度を最初のリンクごとに定義できますが、それが測度であり、それが難しい部分であることを示す必要があります。ただし、この議論をやめることに同意します。
アメーバ

3
私はあなたの答えを読むのを本当に楽しみました。私はあなたに感謝する方法がわかりませんが、あなたは物事をたくさん明らかにしました!実際の分析を勉強したことも、数学を適切に紹介したこともありません。電気工学のバックグラウンドから来て、実際の実装に重点を置いていました。私のような中傷者が理解できるほど簡単な言葉でそれを書いた。あなたの答えとあなたが提供してくれたシンプルさに本当に感謝しています。@ Xi'anもコメントを寄せてくれてありがとう!
ズシャウク

19

(非常に実用的な用語で)基本的なアイデアは単純です。ある調査で働いている統計学者であると仮定します。調査に年齢に関するいくつかの質問があると仮定しますがなどの特定の間隔で年齢を特定するように回答者に依頼するだけです。他の質問を忘れましょう。このアンケートは、「イベントスペース」、あなたの定義します。シグマ代数アンケートから得られるすべての情報を体系化するので、年齢の質問のために(そして今、我々は他のすべての質問を無視するために)、それは間隔含まれていますではなく、のような他の間隔[0,18),[18,25),[25,34),(Ω,F)F[18,25)[20,30)、アンケートで得られた情報からは、回答者の年齢が属しているかどうかなどの質問に答えることができないためです。より一般的には、サンプルポイントがそのセットに属するかどうかを判断できる場合に限り、セットはイベント(属する)です。[20,30)F

次に、2番目のイベントスペース値を使用してランダム変数を定義します。例として、これを通常の(ボレル)シグマ代数を持つ実際の線と見なします。次に、ランダム変数ではない(興味のない)関数は "respondents age is prime number"です。年齢が素数の場合は1、それ以外の場合は0としてコーディングします。いいえ、はに属さないため、は確率変数ではありません。理由は簡単です。アンケートの情報から、回答者の年齢が最高かどうかを判断することはできません。これで、より興味深い例を自分で作成できます。 (Ω,F)f:f1(1)Ff

をシグマ代数にする必要があるのはなぜですか?データについて2つの質問をしたいとしましょう。「18歳以上の回答者番号3です」、「回答者3は女性です」。質問で2つのイベント(セット)と定義してみましょう。サンプルポイントのセットは、その質問に「はい」と答えます。次に、「回答者3は18歳以上の女性です」という2つの質問を組み合わせて質問します。その質問は、交差点表されます。同様に、選言は集合union表されます。F A B A B A BFFABABAB。現在、可算の交差点および共用体に閉じ度を要求することで、可算の接続詞または分離を要求できます。そして、質問を否定することは補完的な集合によって表されます。それはシグマ代数を与えます。

この種の紹介は、Peter Whittleの非常に良い本「期待による確率」(Springer)で最初に見ました。

編集

コメントでwhubersの質問に答えようとすると、「このアサーションに出会ったとき、私は最後に少し驚きました。これが問題の核心になっているようです:なぜ誰もがそのような無限に複雑なイベントを構築したいのでしょうか?」ここで、離散確率に制限します。便宜上、コインを投げることにしましょう。コインを有限回数投げると、コインを使用して記述することができるすべてのイベントは、タイプ「head on throw」、「tails on throw」、および有限数の「and」または「or」のイベントによって表現できます。 。したがって、この状況では、は必要ありません。σ σ N σ N σiiσ-代数、集合の代数で十分です。だから、この文脈で、代数が発生する状況はありますか?実際には、サイコロを有限回数しか投球できない場合でも、投球数無限に増加する、限界定理を介して確率の近似値を作成します。したがって、この場合の中心極限定理、ラプラス・ド・ムーブルの定理の証明を見てください。代数のみを使用した近似により証明できますが、 -algebraは必要ありません。大きい数の弱い法則は、チェビシェフの不等式によって証明できます。そのためには、有限ケースの分散を計算するだけです。しかし、多数の強い法則のためにσnσn、我々が証明するイベントは、「and」と「or」の数え切れないほどの数でしか表現できない確率を持っているので、大きな数の強い法則には代数が必要です。 σ

しかし、本当に大きな数の強い法則が必要なのでしょうか?ここの1つの答えによると、そうではないかもしれません。

ある意味では、これは多数の強い法則と弱い法則の非常に大きな概念上の違いを示しています。強い法則は、経験的に検証できない実際の収束に関するものであるため、経験的に直接意味がありません。一方、弱い法則は、有限数値境界を使用してとともに増加する近似の品質に関するものであるため、より経験的に意味があります。nnn

したがって、離散確率のすべての実用的な使用は、代数なしで行うことができます。継続的なケースの場合、私はよくわかりません。 σ


4
この答えは、 -fieldsが必要な理由を示しているとは思わない。に答えられることの便利さは、数学によって義務付けられていません。やや不愉快なことに、統計学者にとって何が便利かは数学が気にかけないと言うかもしれません。実は、私たちが知っている、され、それはこの例では、あなたはそれが欲しいものを示していることでも明らかではないので、まあ、定義されました。P A [ 20 30 P A [ 20 30 P A [ 18 34 σP(A)[20,30)P(A)[20,30)P(A)[18,34)
-Sycorax

5
この回答のいずれでも、「 -algebra」の「」部分は必要ありません。Kjetil。実際、基本的なモデリングと確率についての推論のために、働く統計学者は、可算ではなく有限のユニオンの下でのみ閉じられる集合代数でうまくいくようです。我々は可算の下で閉鎖を必要とする理由アントニの質問の懸念の難しい部分無限組合:これは、被験者が測定論の代わりに、基本的組合せとなる点です。(アクサカルも最近削除された回答でその点を指摘したようです。)σσσ
whuber

2
@whuber:もちろんあなたは正しいですが、私の答えでは、代数(または -algebras)が情報を伝えることができる理由について、やる気を出そうとします。それは、そのアルゴリズムの構造が確率ではなく、他の何かに入る理由を理解する方法です。もちろん、user777の回答で説明されている技術的な理由もあります。そして、もちろん、私たちは、誰もが幸せになる簡単な方法で確率を行うことができれば...σ
はKjetil BはHalvorsenの

3
あなたの議論は正しいと思います。しかし、このアサーションに出会ったとき、私は最後に少し驚いた。「可算の交差点と結合に閉ざしを要求することで、可算の接続詞または分離を要求できる」。これが問題の核心になっているようです:なぜ誰もそのような無限に複雑なイベントを構築したいのでしょうか?それに対する良い答えは、あなたの投稿の残りをより説得力のあるものにするでしょう。
whuber

2
実用的な用途:金融の数学(確率微分方程式、伊藤積分、代数のフィルター処理などを含む)で使用される確率と測定の理論は、シグマ代数なしでは不可能に見えます。(あなたの答えにすでに投票しているので、私は編集に賛成できません!)
whuber

2

確率論者が代数を必要とするのはなぜですか?σ

代数の公理は、確率によってかなり自然に動機付けられます。すべてのベン図の領域、たとえば、を測定できるようにします。この記憶に残る答えから引用するには:σB B CAB(AB)C

最初の公理は∅、𝑋∈𝜎です。さて、あなたは常に何も起こらない確率(0)または何かが起こる確率(1)を知っています。

2番目の公理は補数の下で閉じられます。愚かな例を挙げましょう。繰り返しますが、coin = {𝐻、𝑇}のコインフリップを検討してください。このフリップの𝜎代数は{∅、𝑋、{𝐻}}であると言います。つまり、私は何も起こらない、何が起こるのか、頭が出る確率は知っていますが、尻尾の確率はわかりません。あなたは当然私をバカと呼ぶでしょう。あなたが頭の確率を知っているなら、あなたは自動的に尾の確率を知っているからです!何かが起こる可能性を知っているなら、それが起こらない確率を知っている(補数)!

最後の公理は、可算組合の下で閉じられます。別の愚かな例を挙げましょう。ダイスのロール、またはConsider = {1,2,3,4,5,6}を考慮してください。for代数が{the、𝑋、{1}、{2}}であると言ったらどうでしょう。つまり、1を振る確率または2を振る確率は知っていますが、1または2を振る確率はわかりません。繰り返しますが、あなたは正当に私を馬鹿と呼ぶでしょう(理由が明確であることを望みます)。セットがばらばらではないときに何が起こるか、そして数えられないユニオンで何が起こるかは少し厄介ですが、いくつかの例を考えてみてください。

なぜ、有限の -additivity ではなくcountableが必要なのですか?σ

まあ、それは完全にきれいなケースではありませんが、いくつかの確かな理由があります。

なぜ確率論者は対策が必要なのですか?

この時点で、メジャーのすべての公理はすでにあります。 -additivity、非負、ヌル空のセット、およびドメイン -代数。がメジャーであることも必要になる場合があります。メジャー理論はすでに正当化されています。σσP

人々はビタリのセットとバナッハ・タルスキを持ち込んで、なぜ測定理論が必要なのかを説明しますが、それは誤解を招くと思います。Vitaliのセットは、確率空間が必要としない翻訳不変の(重要な)メジャーに対してのみ無効になります。また、Banach-Tarskiには回転不変性が必要です。分析の人々はそれらを気にしますが、確率論者は実際に気にしません

確率論における測定理論の存在理由は、離散的RVと連続RVの扱いを統一することであり、さらに、混合されたRVと単純にどちらでもないRVを考慮に入れることです。


少しやり直せば、この答えはこのスレッドに大きな追加になると思います。現状では、その大部分は他のコメントスレッドへのリンクに依存しているため、追跡するのは困難です。測度、有限 -additivityおよび -algebraが確率空間の必要な特徴としてどのように適合するかについて、下から上への説明としてレイアウトすれば、それははるかに強力になると思います。あなたはすでに答えをさまざまなセグメントに分割しているため、あなたは非常に近いですが、セグメントが完全にサポートされるためには、より多くの正当化と推論が必要だと思います。σσσ
Sycorax
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.