標準誤差を導出するための一般的な方法


10

標準エラーを導出する一般的な方法をどこにも見つけられないようです。私はグーグル、このウェブサイト、そして教科書でさえ調べましたが、私が見つけることができるのは、平均、分散、比率、リスク比などの標準誤差の式であり、これらの式に到達した方法ではありません。

簡単な言葉でそれを説明したり、私にそれを説明する優れたリソースにリンクしたりすることができれば、感謝します。


2
stats.stackexchange.com/a/18609/919の投稿で、一般的な単純なモデルを提供し、すべての詳細を考慮して適用します。これと標準エラーに関する他の多くの投稿(これまでにおよそ1000件)は、「標準エラー」を
whuber

回答:


21

求めたいのは、平均の標本分布の標準偏差です。つまり、平易な英語では、標本分布は母集団から項目を選択し、それらを加算して、合計を除算したものです。次に、この量の分散を見つけ、その分散の平方根をとることによって標準偏差を取得します。nnn

したがって、選択する項目を確率変数で表し、それぞれの変数が分散分布するようにします。それらは独立してサンプリングされるため、合計の分散は分散の合計です。 σ 2ヴァーN Σ I = 1 X I = N Σ iは= 1ヴァーをX I = N Σ I = 1 σ 2 = N σ 2Xi,1inσ2

Var(i=1nXi)=i=1nVar(Xi)=i=1nσ2=nσ2

次に割ります。一般的にであることを知っているので、を置くとVar k Y = k 2 Var Y k = 1 / nnVar(kY)=k2Var(Y)k=1/n

Var(i=1nXin)=1n2Var(i=1nXi)=1n2nσ2=σ2n

最後に平方根を取り、標準偏差を取得します。母標準偏差が利用できない場合、サンプル標準偏差が推定値として使用され、ます。 ssσnssn

上記のすべてはの分布に関係なく当てはまりますが、標準エラーで実際に何をしたいのかという疑問が生じます。通常、信頼区間を作成する必要がある場合は、平均を含む信頼区間を作成する確率を割り当てることが重要です。Xi

あなたの場合は sは正常に配信され、その後、サンプリング分布も正規分布しているので、これは、簡単です。平均のサンプルの68%は真の平均の1標準誤差内にあり、95%は2標準誤差内にある、などと言えます。Xi

十分に大きいサンプルがある場合(またはサンプルが小さく、が異常でない場合)、中心極限定理を呼び出して、標本分布がほぼ正規分布であり、確率ステートメントも近似であると言えます。Xi

適切な例は、比率推定することです。ここでは、ベルヌーイ分布からそれぞれアイテムを描画します。各分布の分散はであるため、標準誤差は(比率はデータを使用して推定されます)。次に、サンプルの約%が平均の標準偏差の範囲内にあるということを示すには、サンプリング分布がほぼ正規である場合を理解する必要があります。ベルヌーイ分布からの繰り返しサンプリングは、二項分布からのサンプリングと同じです。一般的な経験則の1つは、とが場合のみ近似することn X i p 1 p pnXip(1p)p(1p)/npnpn(1p)5。(2項式を標準で近似することについての詳細な説明については、ウィキペディアを参照してください。比率を使用した標準誤差の実際の例については、こちらを参照してください。)

一方、サンプリング分布を正規分布で近似できない場合、標準誤差はあまり役に立ちません。たとえば、非常に歪んだ非対称の分布では、サンプルの同じ%が平均の両側の標準偏差であるとは言えず、確率をサンプルに関連付ける別の方法を見つけたい場合があります。±1


おかげで、このアプローチは意味があり、それが平均にどのように適用されるかはわかりますが、他の統計に拡張する方法はわかりません。たとえば、レートの標準誤差はどのようにして見つけますか?またはレート比?
Daniel Gardiner 14年

投稿を更新しました。重要な点は、平均、分散などの量、つまりstderrがあらゆる分布で見つかることです。しかし、確率ステートメントを作成するには、正規分布、二項分布など、分布について何かを知る必要があります。したがって、stderrは常に見つかる可能性がありますが、それがどれほど役立つかは状況によって異なります。
TooTone 2014年

nが固定されていて、母集団全体のほんの一部を表す場合、なぜと記述したのですか?はないvar(Xi)=σ2s2
Oleg

1
@Olegは確率変数であり、それが何であるかを知らなくても、分散があります。は分散の推定値であり、これはほぼ確実に母集団分散ではないため、variance()=と記述するのは誤りです。単純な確率規則を使用しているため、分散は通常は不明ですが、標本の合計または標本の平均の分散を取得する方が簡単です。直線性を使用するだけです。つまり、合計の分散=分散の合計です。分散を導出したら、分散()がわからないことを "覚えている" ので、XiXis2s2Xis2
TooTone

4

標準誤差は、統計の標準偏差です(テストしている場合は、帰無仮説の下で)。標準誤差を見つける一般的な方法は、まず統計の分布またはモーメント生成関数を見つけ、2番目の中心モーメントを見つけて、平方根を求めることです。

たとえば、平均および分散正規分布からサンプリングする場合、サンプルの平均はは通常、平均および分散分布します。これは、3つのプロパティから導出できます。μσ2X¯=1ni=1nXiμσ2/n

  1. 独立確率変数の合計は正常です、
  2. E[i=1naiXi]=i=1naiE[Xi]
  3. とが独立している場合、。X1X2Var(a1X1+a2X2)=a12Var(X1)+a22Var(X2)

したがって、分散の平方根である標本平均の標準誤差はです。σ/n

統計の分布を必ずしも見つける必要はないように、ショートカットがありますが、概念的に分布を知っている場合は、分布を心の奥に置くと便利だと思います。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.