二変量二項分布を可視化する


11

質問: 3次元空間では2変量2項分布はどのように見えますか?

以下は、パラメーターのさまざまな値について視覚化したい特定の関数です。つまり、p 1、およびp 2です。np1p2

f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.

2つの制約があることに注意してください。およびp 1 + p 2 = 1です。さらに、nは正の整数、たとえば5です。x1+x2=np1+p2=1n5

LaTeX(TikZ / PGFPLOTS)を使用して関数をプロットする試みが2回行われました。そうすることで、p 1 = 0.1p 2 = 0.9、およびn = 5p 1 = 0.4p 2 = 0.6の値について、以下のグラフを取得します。ドメイン値に制約を実装することに成功していません。x 1 + x 2 = nなので、少し困惑しています。n=5p1=0.1p2=0.9n=5p1=0.4p2=0.6x1+x2=n

任意の言語(R、MATLABなど)で作成された視覚化は問題ありませんが、私はTikZ / PGFPLOTSを使用してLaTeXで作業しています。

最初の試み

p 1 = 0.1および p 2 = 0.9n=5p1=0.1p2=0.9

ここに画像の説明を入力してください

2回目の試み

p 1 = 0.4および p 2 = 0.6n=5p1=0.4p2=0.6

ここに画像の説明を入力してください

編集:

参考のため、ここではいくつかのグラフを含む記事があります。論文のタイトルは、Atanu BiswasaとJing-Shiang Hwangによる「新しい2変量2項分布」です。Statistics&Probability Letters 60(2002)231–240。

編集2: わかりやすくするため、およびコメントの@GlenBへの応答として、以下は私の本で配布がどのように提示されたかのスナップショットです。この本では、縮退/非縮退のケースなどについては触れていません。それは単にそのようにそれを提示し、私はそれを視覚化しようとしました。乾杯!また、@ JohnKによって指摘されているように、x1 + x1 = 1に関して誤植がある可能性が高く、これはx1 + x1 = nである必要があると示唆しています。

ここに画像の説明を入力してください

方程式の画像:

Spanos、A(1986)計量経済モデリングの統計的基礎。ケンブリッジ大学出版局


5
しかし、それは継続的であるべきではありませんか?両方の確率変数は離散です。
JohnK、2016年

1
したがって、x1とx2は独立していますが、そうですか?疑似3Dプロットが必要ですか?ヒートマップは受け入れられますか?
gung-モニカの回復


2
x1+x2=np1+p2=1X1Binomial(n,p1)X2nX1

3
質問に2変量2項の仕様がありません。(おそらく「二項」と呼ぶことができる二変量分布を指定する方法は複数あります。それらのどれもありませんが、退化したものはそれらのいくつかの特殊なケースになります。)...の描画Biswasa&Hwang参照は、離散2変量pmfの適切な表示ではありません。簡単に言うと、あなたの質問は描くものないので、あなたの参照は主に避けるべきものの例として役立ちます。
Glen_b-2016

回答:


8

これには2つの部分があります。最初に個々の確率を理解する必要があり、次にそれらを何らかの形でプロットする必要があります。

ni=nj=506×6=36

最初は限界二項PMFを計算できます。これは非常に単純だからです。変数は独立しているので、各同時確率は限界確率の積になります。これは行列代数です。ここでは、Rコードを使用してこのプロセスを示します。

b1 = dbinom(0:5, size=5, prob=0.1);  sum(b1)  # [1] 1
b9 = dbinom(0:5, size=5, prob=0.9);  sum(b9)  # [1] 1
b4 = dbinom(0:5, size=5, prob=0.4);  sum(b4)  # [1] 1
b6 = dbinom(0:5, size=5, prob=0.6);  sum(b6)  # [1] 1

b19 = b1%o%b9;  sum(b19)  # [1] 1
rownames(b19) <- colnames(b19) <- as.character(0:5)
round(b19, 6)
#       0        1        2        3        4        5
# 0 6e-06 0.000266 0.004783 0.043047 0.193710 0.348678
# 1 3e-06 0.000148 0.002657 0.023915 0.107617 0.193710
# 2 1e-06 0.000033 0.000590 0.005314 0.023915 0.043047
# 3 0e+00 0.000004 0.000066 0.000590 0.002657 0.004783
# 4 0e+00 0.000000 0.000004 0.000033 0.000148 0.000266
# 5 0e+00 0.000000 0.000000 0.000001 0.000003 0.000006
b46 = b4%o%b6;  sum(b46)  # [1] 1
rownames(b46) <- colnames(b46) <- as.character(0:5)
round(b46, 3)
#       0     1     2     3     4     5
# 0 0.001 0.006 0.018 0.027 0.020 0.006
# 1 0.003 0.020 0.060 0.090 0.067 0.020
# 2 0.004 0.027 0.080 0.119 0.090 0.027
# 3 0.002 0.018 0.053 0.080 0.060 0.018
# 4 0.001 0.006 0.018 0.027 0.020 0.006
# 5 0.000 0.001 0.002 0.004 0.003 0.001

この時点で、2つの必要な確率行列があります。それらをどのようにプロットするかを決定する必要があるだけです。正直なところ、私は3D棒グラフの大ファンではありません。R私と同じように思われるので、私はこれらのプロットをExcelで作成しました:

b19

ここに画像の説明を入力してください

b46

ここに画像の説明を入力してください


プレゼンテーションとRコードをありがとうございます。これにより、x1 + x2 = nについて尋ねるようになります。この条件が成立する場合は、ここで提示され、そこだけの柱の一つの行でなければなりません:reference.wolfram.com/language/ref/MultinomialDistribution.html私は仮定タングステングラフは@Glen_bが退化ケースと呼ばしている何ですか?これは、退化していないケースを提示したことを意味しますか?
Graeme Walsh

1
GraemeWalsh、私のプレゼンテーションでは、x1 + x2 = nの2変量2項を示していません。@Glen_bがコメントと彼の回答で広範囲に議論したように、私はそれを修飾せずに「二変量二項分布」と実際に呼ぶことはありません。さらに、あなたの応答コメントで言ったように、x1とx2は独立していないが、完全に依存していることを意味します。実際、私はこれがそのような奇妙な変形であることに気づきませんでした(十分に注意深く読んでいないと私を責めることができます)。Glen_bが示したように、そのバージョンは柱の単一の行になります。私が提示したのは、非縮退のケースでした。
ガン-モニカの回復

@gung新しいプロットが好きです。あなたの議論は縮退したケースをうまくカバーしていると思います(「個々の確率が何であるかを理解する必要があります」は本当にすべてを言います;縮退したケースの実際の計算は取るに足らないです)。ささいな計算を実行しました。
Glen_b-モニカを2016

7

gungの答えは実際の2変量2項式の良い答えであり、問​​題をよく説明しています(タイトルの質問に対する良い答えとして受け入れることをお勧めします。

x1n

それでは、物事を適切に定義しましょう。確率変数の定義は実際には提供されていないことに注意してください。

Y1binomial(n,p1),P(Y1=y1)y1y1=0,1,...,nX1=Y1/nx1=0,16,26,...,1

P(X1=x1)x2=nx1p2=1p1

n=6,p1=0.3

ここに画像の説明を入力してください

x2x11x1x2

これを(スケーリングされた)縮退2変量2項式と見なすことができます。

ここに画像の説明を入力してください

しかし、本で定義されているものを実際に2変量2項と呼ぶのは少しストレッチです(実質的には1変量2項であるため)。

誰かが3Dプロットと同様のプロットを生成することを想定すると、この(R)コードの少しは、上記の2番目のプロットに非常に近くなります。

y = 0:6
x1 = y/6
x2 = 1-x1
p = dbinom(y,6,.3)
scatterplot3d(x1,x2,p,grid=TRUE, box=FALSE, cex.lab=1.2,
        color=3, cex.main=1.4,pch=21,bg=1,, type="h",angle=120,
        main="degenerate scaled binomial", ylab="x2", xlab="x1", 
        zlab="prob")

scatterplot3d同じ名前の関数を含むパッケージが必要です。)

「真の」(非縮退)2変量2項式では、両方の変数が同時に変動します。これは、特定の種類の2変量2項(この場合は独立していない)の例です。そうでなければ「棒」の森で迷子になるのは簡単すぎるので、私はプロットで異なる色を使うことに頼りました。

ここに画像の説明を入力してください

Xbin(n0,p)Ybin(ny,p)Zbin(nz,p)X1=X+YX2=X+Z

X1X2

n0nynz=Xx1=x2x1+x2=n

[1]:マサチューセッツ州ハムダン(1972)、
「限界インデックスが等しくない2変量2項分布の正規展開」、
International Statistical Review40:3(12月)、pp。277-280


corr(X1,X2)=1

Glen_b。どうもありがとうございました。私が提示した(それは私に提示された)数学オブジェクトが(スケーリングされた)退化した2変量2項であることを指摘すると非常に役に立ちます!私はこれを最初から知りませんでした。最後に、初級リクエスト!真または実際の二変量二項式をどのように定義するかについて、(数学表記によって)明示的にすることは可能でしょうか?それは有用だと思います。
Graeme Walsh

1
Xbin(n0,p)Ybin(ny,p)Zbin(nz,p)X1=X+YX2=X+Z

1
X1X2

@Graeme ...さらに詳細を追加する予定です。
Glen_b-2016

4

Mathematica今ではそのようなことに非常に強いです-それはあなたの問題の解決策をドキュメンテーションで正しく持っています。少しの追加で、私は遊んでいるモデルを作りました(p = p1 = 0.4より良い視覚的表現のために)。これがインターフェースの外観と制御方法です。

ここに画像の説明を入力してください

スニペット

Manipulate[
 Grid[{
   {DiscretePlot3D[
     PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right],

    DiscretePlot3D[
     CDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right]}
   }]
 ,
 {{n, 5}, 1, 20, 1, Appearance -> "Labeled"},
 {{p, 0.4}, 0.1, 0.9},
 TrackedSymbols -> True
 ]

ここでの主なものはPDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}]、一目瞭然であると思います。それぞれの変数Multinomialごとに多くの分布をとることができることを意味しますpi。シンプルな形ですBinomialDistribution。もちろん、手動で作成することもできますが、ルールは、組み込み関数があるかどうかです-使用する必要があります。

コードの構造についてコメントが必要な場合は、お知らせください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.