iidデータの逆説(少なくとも私にとって)


24

統計に関する私の集計(および乏しい)知識が許す限り、がiidのランダム変数である場合、用語が示すように、それらは独立しており、同一に分布しています。バツ1バツ2バツn

ここでの私の懸念は、iidサンプルの以前のプロパティです。これは、

pバツn|バツ1バツ2バツk=pバツn

個別ののst。 1 I 、J < Nj1j<n

ただし、同一の分布の独立したサンプルの集合が分布構造に関する情報を提供し、上記の場合の結果としてに関する情報を提供することを知っているので、実際には、 バツn

pバツn|バツ1バツ2バツk=pバツn

私は間違いの犠牲者であることは知っていますが、その理由はわかりません。これで私を助けてください。


ベイズ規則を知っていますか?古典を聞いた。対ベイジアン統計?事前?
マシューガン

1
私はあなたの質問の終わりに議論に従わない。もっと明示できますか?
グレン_b-モニカを復元

@Glen_b正確にあなたが従わないことは何ですか?あなたはそれの終わりまでに何を意味しますか?私は平等と不平等の両方を異なる論理で言いたいと思っていますが、これは逆説です。
キューピター

ここにはパラドックスはありません。適切な定義を適用できなかっただけです。使用する単語の意味を無視すると、パラドックスがあると主張することはできません!この場合、独立の定義を確率の定義と比較すると、エラーが明らかになります。
whuber

@whuber、あなたは私の質問のタイトルに明示的な「(少なくとも私にとって)」と、私の議論の「誤acy」を見つけるために助けを求めるという事実に気づいたと仮定します。実際、本当のパラドックスではありません。
キューピター

回答:


30

分布の推定モデルランダム変数を混同している思います。独立性の仮定を次のように書き換えましょう: これはX n(そして、例えば、パラメータのセットθによってそれを識別することができます

(1)P(Xn|θ,Xi1,Xi2,,Xik)=P(Xn|θ)
Xnθ)分布は、そこからいくつかのサンプルを観察した場合には変化しません。

たとえば、は、コインのn番目のトスの結果を表すランダム変数と考えてください。X nの分布を知るには、コインの尾の確率を知ること(ところで、θでエンコードされていると仮定)で十分です。特に、前のトスの結果は、n番目のトスのまたは尾の確率を変更せず、1 が成立します。バツnnθバツnn1

ただし、であることに注意してください。Pθ|バツnPθ|バツ1バツ2バツk


どうもありがとうございました。かなり先まで。少しおかしいのですが、少し前にそのような答えを推測していましたが、それを忘れていました....だから、誤解は、ランダム変数の分布をパラメータ化できる「モデル」を暗黙的に仮定することでわかります。私はそれを正しくしましたか?
キューピター

1
@Cupitor:役立ってよかった。はい、モデルを条件として、独立したランダム変数は互いに影響しません。ただし、基礎となる(真の)分布からより多くのサンプルを見ると(独立性の仮定に関係なく)、与えられた分布が一連の結果の変化を生成する可能性があります。
ソビ

15

あなたはベイズ的アプローチとの分布記述する御馳走パラメータ取る場合は確率変数/ベクトルとしての、その後の観測は確かにありません独立したが、それらは以下のようになり、条件付き独立したの知識与えられたθので、P X N | X N - 1... X 1θ = P X N | θ 開催します。バツθPバツnバツn1バツ1θ=Pバツnθ

古典的な統計的アプローチでは、確率変数ではありません。計算は、θとは何かを知っているかのように行われます。ある意味では、(値がわからなくても)常にθを調整しています。θθθ

「...分布構造に関する情報を提供し、に関する結果として」を書いたとき、あなたは暗黙のうちにベイジアンアプローチを採用していましたが、正確にはしていませんでした。頻繁に使用するIIDサンプルのプロパティを作成していますが、ベイジアン設定の対応するステートメントにはθの条件付けが含まれます。バツnθ

ベイジアン統計学者対古典統計学者

みましょう偏った、不公平なコイン投げの結果です。コインが頭に着く確率はわかりません。バツ

  • 古典統計学者にとって、頻度論者は何らかのパラメーターです。これをθと呼びましょう。ここで、θは1/3のようなスカラーであることに注意してください。数字がわからないかもしれませんが、数字です!ランダムではありませんPバツ=Hθθ
  • ベイズ統計学者にとって、自体はランダム変数です!これは非常に異なります!θ

ここでの重要な考えは、ベイズ統計学者が確率のツールを古典統計学者がしない状況に拡張するということです。頻度の高い人にとって、1つの可能な値しかないため、ランダム変数ではありません!複数の結果は不可能です!しかし、ベイジアンの想像では、θの複数の値が可能であり、ベイジアンは確率ツールを使用してその不確実性を(彼自身の心で)喜んでモデル化します。θθ

これはどこに行くの?

コインを回裏返すとしましょう。1回のフリップは、他のフリップの結果に影響しません。古典的な統計学者は、これらの独立したフリップを呼び出します(実際、それらはフリップです)。:私たちは持っているよ P X N = H | xはN - 1はxはN - 2... xは1= P X N = H = θ θは、いくつかの未知のパラメータです。(それが何であるかはわかりませんが、ランダム変数ではありません!それはいくつかの数字です。)n

Pバツn=Hバツn1バツn2バツ1=Pバツn=H=θ
θ

ベイジアンの主観的確率を深く考えると、重要なのは彼女の観点からの確率だと言うでしょう。彼女が10個のヘッドを連続して見た場合、11個目のヘッドは、連続して10個のヘッドがコインをヘッドに有利に偏っていると信じさせるため、より可能性が高くなります。

Pバツ11=Hバツ10=Hバツ9=Hバツ1=H>Pバツ1=H

θθθ

Pバツ11=Hバツ10=Hバツ9=Hバツ1=Hθ=Pバツ1=Hθ=θ

θθ

さらなるメモ

私はここで短いイントロを提供するために最善を尽くしましたが、私がやったことはせいぜい表面的なものであり、概念はある意味でかなり深いものです。確率の哲学、Savageの1954年の著書、Foundation of Statisticsは古典的です。ベイジアン対フリークエンティストのためのグーグルとたくさんのものが登場します。

IIDの描画について考える別の方法は、デフィネッティの定理交換可能性の概念です。ベイジアンフレームワークでは、交換可能性は、潜在的なランダム変数(この場合、コインの片側性)を条件とする独立性と同等です。


本質的に、ベイジアンアプローチは、ステートメント「iidランダム変数」を、それらがIID でなければならないという公理としてではなく、そうであるという非常に強力な事前の仮定として扱います-そして、より強力な証拠が、仮定が真実であれば、この「与えられた条件に対する不信」は結果に反映されます。
ペテルス

ご回答ありがとうございます。私はそれを支持しましたが、Sobiの答えは問題がどこにあるか、つまりモデル構造を暗黙的に仮定する(またはこれは私が理解した限り)
2015

1
@マシュー・ガン:きちんとしていて、徹底的で、とてもよく説明されています!回答からいくつかのことを学びました、ありがとう!
ソビ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.