加重平均推定の標準誤差の計算


16

その仮定とそれぞれ描かれているIIDと、いくつかのディストリビューションからの独立した。厳密に正です。すべての観察しますが、は観察しません。むしろを観察します。この情報からを推定することに興味があります。明らかに、推定器 \ bar {x} = \ frac {\ sum_i w_i x_i} {\ sum_i w_i} は偏りがなく、手元にある情報を基に計算できます。w1,w2,,wnw i x i w i w i x i i x i w ix1,x2,...,xnwixiwiwixiixiwiE[x]

x¯=iwixiiwi

この推定器の標準誤差をどのように計算できますか?xiが値0と1のみをとるサブケースでは、

sex¯(1x¯)iwi2iwi,
基本的に変動を無視してwiが、これは250の周りよりも小さいサンプルサイズの不振ことがわかった(そして、これはおそらくの分散に依存wi。)多分私がするのに十分な情報を持っていないようです「より良い」標準誤差を計算します。

回答:


17

最近同じ問題に遭遇しました。以下は私が見つけたものです:

重みが等しい単純な無作為標本とは異なり、加重平均の標準誤差の広く受け入れられている定義はありません。最近では、ブートストラップを実行して平均の経験的分布を取得し、それに基づいて標準誤差を取得するのは簡単です。

この推定を行うために数式を使用したい場合はどうなりますか?

主な参考文献は、ドナルドF.ガッツとルーサースミスによるこの論文で、3つの式ベースの推定量がブートストラップの結果と比較されます。ブートストラップの結果に対する最良の近似は、Cochran(1977)から得られます。

(SEMw)2=n(n1)(Pi)2[(PiXiP¯X¯w)22X¯w(PiP¯)(PiXiP¯X¯w)+X¯w2(PiP¯)2]

以下は、このR listserveスレッドから来た対応するRコードです。

weighted.var.se <- function(x, w, na.rm=FALSE)
#  Computes the variance of a weighted mean following Cochran 1977 definition
{
  if (na.rm) { w <- w[i <- !is.na(x)]; x <- x[i] }
  n = length(w)
  xWbar = weighted.mean(x,w,na.rm=na.rm)
  wbar = mean(w)
  out = n/((n-1)*sum(w)^2)*(sum((w*x-wbar*xWbar)^2)-2*xWbar*sum((w-wbar)*(w*x-wbar*xWbar))+xWbar^2*sum((w-wbar)^2))
  return(out)
}

お役に立てれば!


これはかなりクールですが、私の問題のために、私はさえ観察しません、むしろ私は合計を観察します。私の質問は、情報の非対称性を伴うため、非常に奇妙です(第三者が合計を報告し、おそらくいくつかの情報を隠そうとしています)。PiXiiPiXi
みすぼらしいシェフ

そうですね、ごめんなさい、あなたが出した質問を完全に理解できませんでした。問題を、すべてのがベルヌーイRV である最も単純なケースにするとします。次に、本質的に RVのランダムなサブセットの合計を観察しています。私の推測では、推定する情報はここにはあまりありません。それで、元の問題に対して何をしましたか?win
ミンチー花王

@ Ming-ChihKaoこのコクラン式は興味深いですが、データが正常でないときにこれから信頼区間を構築すると、一貫した解釈が正しくありませんか?非正規加重平均信頼区間をどのように扱いますか?加重分位数?
user3022875

関数にエラーがあると思います。あなたが代替する場合w=rep(1, length(x))、それweighted.var.se(rnorm(50), rep(1, 50))は約0.014です。のsum(w^2)場合P=1、分散はであるため、式には分子のaが欠けていると思います1/(n*(n-1)) * sum((x-xbar)^2)。引用された記事はペイウォールの裏にあるので確認できませんが、その修正はあると思います。:全ての重みが等しい場合に奇妙なことに、ウィキペディアの(異なる)ソリューションは、縮退なりen.wikipedia.org/wiki/...
マックスカンドシア

これらは一般的にうまく機能する可能性があります:analyticgroup.com/download/WEIGHTED_MEAN.pdf
Max Candocia

5

が 与えられた場合の推定値の分散は、 推定値はに対して不偏であるため、その条件付き平均の分散はゼロです。したがって、推定の分散は 観測されたすべてのデータで、これは経験的に簡単に推定できます。しかし、の位置の測定値のみが観察され、それらの広がりはないため、かなり厳しい仮定を行わずに推定値を取得する方法がわかりません。wi

wi2Var(X)(wi)2=Var(X)wi2(wi)2.
wi
Var(X)E(wi2(wi)2)
XiVar(X)

少なくともがベルヌーイ分布を持つ特定のケースでは、上記のようにによっての分散を推定できます。この場合でも、質問で述べたように、予想よりも大きいサンプルサイズが必要です。xixx¯(1x¯)
みすぼらしいシェフ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.