分散のリストからある種の「平均」を取得する必要がありますが、妥当な解決策を見つけるのに問題があります。このスレッドでは、ピタゴラスの3つの平均(算術、幾何学、調和)の違いについて興味深い議論があります。しかし、私はまだそれらのどれもが良い候補になるとは思いません。助言がありますか?
PS一部のコンテキスト-これらの分散は、人の被験者からのサンプル分散であり、各被験者はほぼ同じサンプルサイズ同じ実験計画を通過しました。つまり、被験者に対応する標本分散、、...、あります。メタ分析はすでに人口レベルで実行されています。ある種の「平均」または「要約された」サンプル分散を取得する必要がある理由は、メタ分析の後にそれを使用してICCなどのインデックスを計算するためです。K N σ 2 1 σ 2 2 σ 2 N N
PPS議論をより具体的にするために、Rで次の例を使用して問題を説明しましょう。
library(metafor)
dat <- get(data(dat.konstantopoulos2011))
dat$district <- as.factor(dat$district)
dat$school <- as.factor(dat$school)
データセットには、各学校の成績スコアに関連する差異があります。
str(dat)
Classes ‘escalc’ and 'data.frame': 56 obs. of 6 variables:
$ district: Factor w/ 11 levels "11","12","18",..: 1 1 1 1 2 2 2 2 3 3 ...
$ school : Factor w/ 11 levels "1","2","3","4",..: 1 2 3 4 1 2 3 4 1 2 ...
$ year : int 1976 1976 1976 1976 1989 1989 1989 1989 1994 1994 ...
$ yi : atomic -0.18 -0.22 0.23 -0.3 0.13 -0.26 0.19 0.32 0.45 0.38 ...
$ vi : num 0.118 0.118 0.144 0.144 0.014 0.014 0.015 0.024 0.023 0.043 ...
階層的または混合効果モデルでメタ分析を実行するとします。
ここで、とはそれぞれ番目の学校と番目の地区の変量効果であり、は既知のガウス分布の測定誤差です。このモデルは次のように分析できます。β J、I 、J ε I J N (0 、VのI J)
(fm <- rma.mv(yi, vi, random = list(~1 | district, ~1 | school), data=dat))
2つの分散コンポーネントの次の分散推定をレンダリングします。
Multivariate Meta-Analysis Model (k = 56; method: REML)
Variance Components:
estim sqrt nlvls fixed factor
sigma^2.1 0.0814 0.2853 11 no district
sigma^2.2 0.0010 0.0308 11 no school
結果の2つの分散sigma ^ 2.1とsigma ^ 2.2は、2つの変量効果変数(地区と学校)に対応しています。
地区のICCを計算したいので、測定項個々の分散の最初の場所で要約された分散を取得したいと思います。合計分散は ϵ i j
私の元の(そして単純な)アプローチは、算術平均のみを使用することでした:
しかし、算術平均がこのコンテキストで適切かどうかはません。