回答:
TL; DR:混合効果モデルのクラスターあたりの最小サンプルサイズは1です。ただし、クラスターの数が適切で、シングルトンクラスターの割合が「高すぎない」場合
長いバージョン:
一般に、クラスター数はクラスターあたりの観測数よりも重要です。700では、明らかに問題はありません。
クラスターサイズが小さいことは非常に一般的です。特に、層別サンプリング設計に従う社会科学調査では、クラスターレベルのサンプルサイズを調査した一連の調査があります。
クラスターサイズを大きくすると、統計的検出力が増加して変量効果を推定します(Austin&Leckie、2018)、クラスターサイズを小さくしても深刻なバイアスは生じません(Bell et al、2008; Clarke、2008; Clarke&Wheaton、2007; Maas&Hox) 、2005)。したがって、クラスターあたりの最小サンプルサイズは1です。
特に、Bell、et al(2008)は、0%から70%の範囲のシングルトンクラスター(単一の観測のみを含むクラスター)の比率でモンテカルロシミュレーション研究を行い、クラスターの数が多い場合(〜 500)小さいクラスターサイズは、バイアスとタイプ1のエラー制御にほとんど影響を与えませんでした。
彼らはまた、どのモデリングシナリオでもモデルの収束に関する問題をほとんど報告していません。
OPの特定のシナリオでは、最初のインスタンスで700クラスターを使用してモデルを実行することをお勧めします。これに明確な問題がなければ、クラスターをマージすることには消極的です。Rで簡単なシミュレーションを実行しました。
ここでは、残差分散が1のクラスター化データセットを作成します。これも1つのクラスターが1,700クラスターであり、そのうち690がシングルトンで、10が2つの観測値しかありません。シミュレーションを1000回実行し、推定された固定および残差ランダム効果のヒストグラムを観察します。
> set.seed(15)
> dtB <- expand.grid(Subject = 1:700, measure = c(1))
> dtB <- rbind(dtB, dtB[691:700, ])
> fixef.v <- numeric(1000)
> ranef.v <- numeric(1000)
> for (i in 1:1000) {
dtB$x <- rnorm(nrow(dtB), 0, 1)
dtB$y <- dtB$Subject/100 + rnorm(nrow(dtB), 0, 1) + dtB$x * 1
fm0B <- lmer(y ~ x + (1|Subject), data = dtB)
fixef.v[i] <- fixef(fm0B)[[2]]
ranef.v[i] <- attr(VarCorr(fm0B), "sc")
}
> hist(fixef.v, breaks = 15)
> hist(ranef.v, breaks = 15)
ご覧のとおり、固定効果は非常によく推定されていますが、残差のランダム効果は少し下向きにバイアスされているように見えますが、それほど大きくはありません。
> summary(fixef.v)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.6479 0.9439 0.9992 1.0005 1.0578 1.2544
> summary(ranef.v)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.2796 0.7745 0.9004 0.8993 1.0212 1.4837
OPは、クラスターレベルの変量効果の推定に特に言及しています。上記のシミュレーションでは、変量効果は単に各Subject
のIDの値として作成されました(100倍に縮小)。明らかにこれらは正規分布ではありません。これは線形混合効果モデルの仮定ですが、クラスターレベルの効果(の条件モード)を抽出し、実際のSubject
ID に対してプロットできます。
> re <- ranef(fm0B)[[1]][, 1]
> dtB$re <- append(re, re[691:700])
> hist(dtB$re)
> plot(dtB$re, dtB$Subject)
ヒストグラムはある程度正常から逸脱していますが、これはデータのシミュレーション方法が原因です。推定された変量効果と実際の変量効果の間には、依然として妥当な関係があります。
参照:
Peter C. Austin&George Leckie(2018)マルチレベル線形およびロジスティック回帰モデルで変量効果分散コンポーネントをテストするときのクラスターの数とクラスターサイズが統計的検出力とタイプIのエラー率に及ぼす影響、ジャーナルオブ統計計算とシミュレーション、88: 16、3151-3163、DOI:10.1080 / 00949655.2018.1504945
ベル、BA、フェロン、JM、およびクロムレイ、JD(2008)。マルチレベルモデルのクラスターサイズ:2レベルモデルの点と間隔の推定に対するスパースデータ構造の影響。JSM Proceedings、Survey Research Methodsに関するセクション、1122-1129。
Clarke、P.(2008)。グループレベルのクラスタリングはいつ無視できますか?マルチレベルモデルとスパースデータを使用したシングルレベルモデル。Journal of Epidemiology and Community Health、62(8)、752-758。
Clarke、P.&Wheaton、B.(2007)。クラスター分析を使用して状況依存の人口調査でデータのスパース性に対処し、合成近傍を作成します。Sociological Methods&Research、35(3)、311-351。
Maas、CJ、&Hox、JJ(2005)。マルチレベルモデリングに十分なサンプルサイズ。方法論、1(3)、86-92。
混合モデルでは、ランダム効果はほとんどの場合、経験的なベイズ法を使用して推定されます。この方法論の特徴は収縮です。つまり、推定された変量効果は、固定効果部分によって記述されたモデルの全体的な平均に向かって縮小されます。収縮の程度は次の2つの要素に依存します。
エラー項の分散の大きさと比較した変量効果の分散の大きさ。エラー項の分散に関連する変量効果の分散が大きいほど、収縮の程度は小さくなります。
クラスター内で繰り返される測定の数。反復測定が多いクラスターのランダム効果推定は、測定が少ないクラスターと比較して、全体の平均に向かって縮小されます。
あなたのケースでは、2番目のポイントがより関連しています。ただし、クラスターをマージするという提案されたソリューションは、最初のポイントにも影響を与える可能性があることに注意してください。