標準エラーを導出する一般的な方法をどこにも見つけられないようです。私はグーグル、このウェブサイト、そして教科書でさえ調べましたが、私が見つけることができるのは、平均、分散、比率、リスク比などの標準誤差の式であり、これらの式に到達した方法ではありません。
簡単な言葉でそれを説明したり、私にそれを説明する優れたリソースにリンクしたりすることができれば、感謝します。
標準エラーを導出する一般的な方法をどこにも見つけられないようです。私はグーグル、このウェブサイト、そして教科書でさえ調べましたが、私が見つけることができるのは、平均、分散、比率、リスク比などの標準誤差の式であり、これらの式に到達した方法ではありません。
簡単な言葉でそれを説明したり、私にそれを説明する優れたリソースにリンクしたりすることができれば、感謝します。
回答:
求めたいのは、平均の標本分布の標準偏差です。つまり、平易な英語では、標本分布は母集団から項目を選択し、それらを加算して、合計を除算したものです。次に、この量の分散を見つけ、その分散の平方根をとることによって標準偏差を取得します。n
したがって、選択する項目を確率変数で表し、それぞれの変数が分散分布するようにします。それらは独立してサンプリングされるため、合計の分散は分散の合計です。 σ 2ヴァー(N Σ I = 1 X I ) = N Σ iは= 1ヴァーを(X I ) = N Σ I = 1 σ 2 = N σ 2
次に割ります。一般的にであることを知っているので、を置くとVar (k Y )= k 2 Var (Y )k = 1 / n
最後に平方根を取り、標準偏差を取得します。母標準偏差が利用できない場合、サンプル標準偏差が推定値として使用され、ます。 ss
上記のすべてはの分布に関係なく当てはまりますが、標準エラーで実際に何をしたいのかという疑問が生じます。通常、信頼区間を作成する必要がある場合は、平均を含む信頼区間を作成する確率を割り当てることが重要です。
あなたの場合は sは正常に配信され、その後、サンプリング分布も正規分布しているので、これは、簡単です。平均のサンプルの68%は真の平均の1標準誤差内にあり、95%は2標準誤差内にある、などと言えます。
十分に大きいサンプルがある場合(またはサンプルが小さく、が異常でない場合)、中心極限定理を呼び出して、標本分布がほぼ正規分布であり、確率ステートメントも近似であると言えます。
適切な例は、比率推定することです。ここでは、ベルヌーイ分布からそれぞれアイテムを描画します。各分布の分散はであるため、標準誤差は(比率はデータを使用して推定されます)。次に、サンプルの約%が平均の標準偏差の範囲内にあるということを示すには、サンプリング分布がほぼ正規である場合を理解する必要があります。ベルヌーイ分布からの繰り返しサンプリングは、二項分布からのサンプリングと同じです。一般的な経験則の1つは、とが場合のみ近似することn X i p (1 − p )√。(2項式を標準で近似することについての詳細な説明については、ウィキペディアを参照してください。比率を使用した標準誤差の実際の例については、こちらを参照してください。)
一方、サンプリング分布を正規分布で近似できない場合、標準誤差はあまり役に立ちません。たとえば、非常に歪んだ非対称の分布では、サンプルの同じ%が平均の両側の標準偏差であるとは言えず、確率をサンプルに関連付ける別の方法を見つけたい場合があります。
標準誤差は、統計の標準偏差です(テストしている場合は、帰無仮説の下で)。標準誤差を見つける一般的な方法は、まず統計の分布またはモーメント生成関数を見つけ、2番目の中心モーメントを見つけて、平方根を求めることです。
たとえば、平均および分散正規分布からサンプリングする場合、サンプルの平均はは通常、平均および分散分布します。これは、3つのプロパティから導出できます。
したがって、分散の平方根である標本平均の標準誤差はです。
統計の分布を必ずしも見つける必要はないように、ショートカットがありますが、概念的に分布を知っている場合は、分布を心の奥に置くと便利だと思います。