二項確率変数のサンプルの平均の標準誤差


44

2つの結果を持つことができる実験を実行しており、2つの結果の基礎となる「真の」分布は、パラメーターn持つ二項分布であると仮定していますpBinomial(n,p)

私は標準誤差を計算することができ、の分散の形から BINOMILNPσ2X=NのP、Q、Q=1-P。だから、σX=SEX=σXnBinomial(n,p)

σX2=npq
q=1p。標準エラーの場合、SEX= √が得られますσX=npq、しかしどこかでSEX= √を見たSEX=pq。私は何を間違えましたか?SEX=pqn

この記事では、平均の標準誤差理解することは非常に有用であるinfluentialpoints.com/Training/...を
Sanghyunリー

私のグーグルから、二項分布の信頼区間を取得するという密接に関連する主題は、かなり微妙で複雑であるように見えます。特に、この式から得られた信頼区間は「ワルド間隔」(en.wikipedia.org/wiki/Binomial_proportion_confidence_intervalを参照)であるように見えますが、振る舞いはかなり悪く、避けるべきです。詳細については、jstor.org / stable / 2676784?seq = 1#metadata_info_tab_contentsを参照してください。
aquirdturtle

回答:


58

サンプルサイズとBinomial確率変数を構成するbernoulli試行の数の両方として、2つの異なる方法で 2回使用しているようです。あいまいさを排除するために、後者を参照するためにkを使用します。nk

お持ちの場合はから独立した試料BのiがN 、O 、M 、I 、LK P の分布、それらのサンプル平均値の分散でありますnBinomial(k,p)

var(1ni=1nXi)=1n2i=1nvar(Xi)=nvar(Xi)n2=var(Xi)n=kpqn

q=1pX¯

var(cX)=c2var(X)Xc

(2)独立したランダム変数の合計の分散は、分散の合計に等しい

X¯kpqn

  • k=npq

  • k=1pqn


3
Xvar(X)=pqXnpvar(X)=npq

2
ありがとう!あなたは私の混乱を解きました。とても初歩的で申し訳ありませんが、私はまだ学んでいます:
フランク

6
222

1
@MichaelChernick、あなたが述べた詳細を明確にしました。問題の説明に基づいて、フランクはこれらの事実を知っていたと考えましたが、詳細は将来の読者にとってより教育的なものになると思います。
マクロ

2
Sol Lago-この場合、k = 1。コインを50回裏返して成功回数を計算し、実験を50回繰り返した場合、k = n = 50になります。コインを
投げる

9

2つの二項分布を混同するのは簡単です。

  • 成功数の分布
  • 成功の割合の分布

npqは成功の数、npq / n = pqは成功の比率です。これにより、さまざまな標準エラー式が作成されます。


6

これは次の方法で確認できます。

nYY=i=1nXiXi

XiY

YY

pqpq=1p

さて、分散を見ると、です。しかし、すべての個々のベルヌーイ実験では、です。実験にはトスまたはベルヌーイ試行があるため、です。これは、に分散があることを意味します。V Y = V X i= V X iV X i= p q n V Y = V X i= n p q Y n p qYV(Y)=V(Xi)=V(Xi)V(Xi)=pqnV(Y)=V(Xi)=npqYnpq

ここで、サンプルの割合はで与えられ、「成功または成功の割合」を与えます。ここで、は定数です。これは、母集団のすべての実験で同じコイントスを使用する予定がないためです。のnp^=Ynn

したがって、。V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n

したがって、(サンプル統計)の標準誤差はp^pq/n


数学の周りにドルを置くことで、ラテックスの植字を使用できます。例えば$x$、を与えます。x
シルバーフィッシュ

ステップ本当に正当化に値することに注意してください!V(Xi)=V(Xi)
シルバーフィッシュ

最後の演ductionにはタイプミスがあります。V(Y / n)=(1 / n ^ 2)* V(Y)=(1 / n ^ 2)* npq = pq / nは正しい演shouldです。
タラシャンカール

おApび申し上げますが、組版を行う際にそれを紹介しました。うまくいけば今すぐソート。
シルバーフィッシュ

1
が無相関の場合、それは事実です。これを正当化するために、試行が独立していると仮定されるという事実を使用します。Xi
シルバーフィッシュ

2

また、最初の投稿で標準誤差と標準偏差の間に混乱があると思います。標準偏差は、分布の分散の平方根です。標準誤差は、その分布からのサンプルの推定平均の標準偏差です。つまり、そのサンプルを無限に繰り返した場合に観測される平均の広がりです。前者は、分布の固有のプロパティです。後者は、分布の特性(平均)の推定の質の尺度です。N Bernouilli試行の実験を行って未知の成功確率を推定する場合、k個の成功を見た後の推定p = k / Nの不確実性は、推定比率sqrt(pq / N)の標準誤差です。ここでq = 1 -p。真の分布は、成功の真の確率であるパラメーターPによって特徴付けられます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.