相関ベルヌーイ試験、多変量ベルヌーイ分布?


14

私は仕事で持っている研究の質問を簡素化しています。私が5枚のコインを持っていると想像して、ヘッドを成功と呼びましょう。これらは成功確率p = 0.1の非常に偏ったコインです。コインが独立している場合、少なくとも1ヘッド以上の確率を取得するのは非常に簡単で、です。私のシナリオでは、私のベルヌーイ試験(コイントス)は独立していません。私がアクセスできる唯一の情報は、成功の確率(それぞれがp = .1です)と、バイナリ変数間の理論的なピアソン相関です。1(11/10)5

この情報だけで1つ以上の成功の確率を計算する方法はありますか?これらの理論的な結果はシミュレーション研究の精度を導くために使用されるため、シミュレーションベースのアプローチを避けようとしています。多変量ベルヌーイ分布を調べてきましたが、相関と成功の限界確率でのみ完全に指定できるとは思いません。私の友人は、ベルヌーイ辺縁でガウスコピュラを構築することを推奨し(Rパッケージを使用copulapMvdc()、大きなサンプルで関数を使用して希望する確率を取得しましたが、どうやってそれを実行するのか正確にはわかりません。


多変量ベルヌーイ分布はここで説明されています:arxiv.org/abs/1206.1874
ティム

試行間に一時的な要素はありますか、それともすべて並行していますか?前者の場合、がにのみ依存するという単純な仮定を立てることができます。ここで、はMarkovモデルの次数を示します。trialitrialinn
ジュバル

回答:


16

いいえ、これは3枚以上のコインを持っているときはいつでも不可能です。

2枚のコインの場合

最初に2つのコインで機能する理由を見てみましょう。これにより、コインが増えた場合に何が壊れるかについての直感が得られます。

ましょとXYベルヌーイは、2つのケースに対応し、変数を分散示すY BのEのRQが。まず、XYの相関がXBer(p)YBer(q)XY

corr(X,Y)=E[XY]E[X]E[Y]Var(X)Var(Y),

あなたは、周辺分布を知っているので、あなたが知っているE [ Y ]V RX 、およびV RYをので、相関関係を知ることによって、あなたも知っている、E [ X Yを]。ここで、X 、Yは= 1の場合に限り、両方のX = 1及びY = 1、そう E [ X 、Y ] = P E[X]E[Y]Var(X)Var(Y)E[XY]XY=1X=1Y=1

E[バツY]=Pバツ=1Y=1

周辺を知ることにより、、およびq = P X = 0 Y = 1 + P X = 1 Y = 1 。私たちは、あなたが知っていることがわかったので、P X = 1 Yをp=Pバツ=1Y=0+Pバツ=1Y=1q=Pバツ=0Y=1+Pバツ=1Y=1、これは、 P X = 1 Y = 0 および P X = 0 Y = 0 も知っていることを意味しますが、あなたが探している確率はPバツ=1Y=1Pバツ=1Y=0Pバツ=0Y=0

Pバツ=1Y=0+Pバツ=0Y=1+Pバツ=1Y=1

今、私は個人的に、これらすべてを写真で見やすくしています。ましょう。次に、さまざまな確率を正方形を形成するものとして描くことができます。Pj=Pバツ=Y=j

ここで、相関関係を知ることは、赤でマークされた推定できることを意味し、周辺を知ることで、各エッジの合計を知っていることを見ました(その1つは青い長方形で示されています)。P11

3枚のコインの場合

これは3枚のコインでは簡単に行かないでしょう。直観的には理由を確認するのは難しくありません:周辺と相関を知ることで、合計パラメーターを知っていますが、共同分布には2 3 = 8の結果がありますが、そのうちの7つの確率を知ることで、最後の1つを把握できます。現在、7 > 6であるため、周辺と相関が同じである2つの異なる共同分布を作成し、探している分布が異なるまで確率を入れ替えることができます。6=3+323=877>6

レッツY、およびZは三つの変数、およびLETことバツYZ

Pjk=Pバツ=Y=jZ=k

この場合、上図は次のようになります。

ここに画像の説明を入力してください

寸法が1つ増えました。赤い頂点がいくつかの色付きのエッジになり、青い長方形で覆われたエッジが面全体になりました。ここで、青い面は、限界を知ることで、内部の確率の合計がわかることを示しています。写真に写っているものについては、

Pバツ=0=P000+P010+P001+P011

キューブ内の他のすべての面についても同様です。色付きのエッジは、相関関係を知ることで、エッジによって接続された2つの確率の合計がわかることを示しています。たとえば、を知ることで、E [ X Y ](上記とまったく同じがわかります。corrバツYE[バツY]

E[バツY]=Pバツ=1Y=1=P110+P111

そのため、これは可能な共同分布にいくつかの制限を課しますが、今ではキューブの頂点に数字を置くという組み合わせの演習に演習を減らしました。さらに苦労せずに、周辺と相関が同じである2つの共同分布を提供します。

ここに画像の説明を入力してください

1001/2Ber1/2

1P0001P000

P111

Ber1/10

4つ以上のコイン

最後に、コインが3枚以上ある場合、失敗する例を作成できることは驚くべきことではありません。これは、共同分布を記述するために必要なパラメーターの数と限界値および相関。

具体的には、3を超える任意の数のコインについて、最初の3つのコインが上記の2つの例のように動作し、最後の2つのコインの結果が他のすべてのコインから独立している例を単純に考慮することができます。


3

相関ベルヌーイ試験では、カウント結果のベータ二項分布が得られます。この分布をパラメーター化して、指定された相関値を与え、必要な確率を計算することができるはずです。


ベータ二項は、成功確率パラメーターがベータに続くランダム変数である単なる二項ではありませんか?それはOPの問題にどのように当てはまりますか?
AG

1
はい、それは分布の特徴です。また、相関するベルヌーイ試験の解決策の1つです(たとえば、Hisakado et al 2006を参照)
モニカの復活

そうです!賛成。
AG

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.