ベータの平均の標本分布


8

私たちは持っていると言います XBeta(α,β)。その標本の標本分布はどういう意味ですか?

つまり、サンプルが意味する分布とは X¯ ベータフォローの?


1
うわー-難しい質問です。一部のパラメーターの選択で発生する奇妙な形状を考えると、アルファとベータのすべての値を特徴付けるのは難しいかもしれませんが、両方が1より大きい場合、CLTごとにガウスに漸近的になる傾向がありますが、私はできません確かに言う。
T3am5hark

4
ランダムサンプルのサンプル平均の漸近分布は、分散が存在する場合は常にCLTによって管理されます。 α,β>1
Christoph Hanck

回答:


2

注:同じ質問についても参照してください/math/85535/sum-of-niid-beta-distributed-variables

一様分布の場合、 Beta(1,1)、多数の独立変数の合計の分布(および平均は関連しています)は、アーウィンホール分布として記述されています。

もし

Xn=i=1nYi with UiBeta(1,1)

その後、あなたは学位のスプラインを持っています n1

fX(x;n)=1(n1)!j=0n1aj(k,n)xj for kxk+1

どこ aj(k,n) 繰り返し関係で説明できます:

aj(k,n)={1k=0,j=n10k=0,j<n1aj(k1,n)+(1)n+kj1(nk)(n1j)knj1k>1


上記の式は、と繰り返したたみこみによって構成され、積分が少しずつ解かれていることがわかります。ベータ分布変数に対してこれをおよび一般化できますか?Xn1Ynαβ

ましょう

Xn(α,β)=i=1nYi with UiBeta(α,β)

関数が個に分割されることを期待します(おそらくスプラインではなくなります)。の分布を計算するたたみ込みは次のようになります。fX(x;n,α,β)nXn(α,β)=Xn1(α,β)+Un

fX(x;n,α,β)=1min(1,nx)min(1,x)fX(xy;n1,α,β)yα1(1y)β1dy

  • 以下のための:n=2

    fX(x;n,α,β)={0xx((xy)y)α1((1x+y)(1y))β1dyif 0x1x11((xy)y)α1((1x+y)(1y))β1dyif 1x2

    • 整数および:αβおよびような用語 は、および整数値。積分は簡単に解決できます。((xy)y)α1((1x+y)(1y))β1αβ

      例えば:

      fX(x;2,2,2)={130x3(x25x+5)if x1130(2x)3(x2+x1)if x1fX(x;2,3,3)={1630x5(x49x3+30x242x+21)if x11630(2x)5(x4+x32x+1)if x1

および整数値のソリューションもスプラインになります。おそらくこれは、より一般的な状況(とやだけではない)のために、いくつかの素晴らしい(またはおそらくそれほど素晴らしいではない)式にキャストできます。しかし、現時点では、この問題に取り組むために、かなりの数のコーヒー、またはより良い注入液が必要です。αβn=2α=β=2α=β=3


1

これは興味深い質問だと思ったので、ここで簡単に視覚的に調べてみましょう。以下のために、Iは、第4の別個のベータ分布(PDFファイル以下に示す)を選択しました。XBeta(α1,α2)

Beta_PDFs

次に、サンプル平均、を収集し、以下に示すように対応するヒストグラムをプロットしました。結果正常に見え、中央限界定理(CLT)がここで機能しているという@ChristophHanckの主張を信じる傾向があります。 X¯=1ni=1nxi

Beta_means


MATLABコード

% Parameters
n = 5000;
K = 5000;
% Define Beta distributions
pd1 = makedist('Beta',0.25,0.45);
pd2 = makedist('Beta',0.25,2.5);
pd3 = makedist('Beta',4,0.15);
pd4 = makedist('Beta',3.5,5);
% Collect Sample Means
X1bar = zeros(K,1);
X2bar = zeros(K,1);
X3bar = zeros(K,1);
X4bar = zeros(K,1);
for k = 1:K                           % get K sample means 
    X1bar(k) = mean(random(pd1,n,1)); % take mean of n samples
    X2bar(k) = mean(random(pd2,n,1));
    X3bar(k) = mean(random(pd3,n,1));
    X4bar(k) = mean(random(pd4,n,1));
end
% Plot Beta distribution PDFs
Xsupport = 0:.01:1;

figure, hold on, box on
title('Beta(\alpha_1,\alpha_2) PDFs')
plot(Xsupport,pdf(pd1,Xsupport),'r-','LineWidth',2.2)
plot(Xsupport,pdf(pd2,Xsupport),'b-','LineWidth',2.2)
plot(Xsupport,pdf(pd3,Xsupport),'k-','LineWidth',2.2)
plot(Xsupport,pdf(pd4,Xsupport),'g-','LineWidth',2.2)
legend('(0.25,0.45)','(0.25,2.5)','(4,0.15)','(3.5,5)')

figure
s(1) = subplot(2,2,1), hold on, box on
    histogram(X1bar,'FaceColor','r')
s(2) = subplot(2,2,2), hold on, box on
    histogram(X2bar,'FaceColor','b')
s(3) = subplot(2,2,3), hold on, box on
    histogram(X3bar,'FaceColor','k')
s(4) = subplot(2,2,4), hold on, box on
    histogram(X4bar,'FaceColor','g')
title(s(1),'(0.25,0.45)')
title(s(2),'(0.25,2.5)')
title(s(3),'(4,0.15)')
title(s(4),'(3.5,5)')

編集:この投稿は、OPを提供するための簡単な試みでした。指摘したように、Central Limit Theorem(CLT)は、これらの結果が有限の分散を持つすべての分布に当てはまることを意味することを知っています。


2
CLTを示す一連の例を実行しました。コメントで述べたように、これらの例ではベータ分布について特別なことは何もありません。文字通り任意の有限分散分布から始めて、同じ結果を得ることができます。
whuber

あなたは正しいです。私はそのコメントに賛成票を投じましたが、コメントがなかったので回答しました。もちろん、CLTは有限分散分布を保持します。私は答えでコメンターにさえ言及しました。この回答を削除する必要がありますか?それともコミュニティにする?
SecretAgentMan 2018
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.