してみましょう学生の応答との予測ベクトルを表す(それぞれ)学校で。 iyij,xijij
(1)バイナリデータの場合、連続データの場合と同様の分散分解を行う標準的な方法は、作成者がリンクでメソッドDと呼びます(以下の他のメソッドについてコメントします)-バイナリデータを線形モデルによって支配され、その潜在スケールの分散を分解する基礎となる連続変数から生じる。その理由は、ロジスティックモデル(およびその他のGLM)が自然にこのように発生するためです。
これを確認するには、定義 して、線形混合モデルによって管理されるようにします。y⋆ij
y⋆ij=α+xijβ+ηj+εij
ここで、は回帰係数、は学校レベルのランダム効果、は残差分散項であり、標準ロジスティック分布を持ちます。さあη J〜N (0 、σ 2)ε I Jα,βηj∼N(0,σ2)εij
yij=⎧⎩⎨⎪⎪10if y⋆ij≥0if y⋆ij<0
せ今、単に我々はロジスティックCDFを使用してpij=P(yij=1|xij,ηj)
pij=1−P(y⋆ij<0|xij,ηj)=exp{−(α+xijβ+ηj)}1+exp{−(α+xijβ+ηj)}
今服用ロジット変換両側の、あなたが持っています
log(pij1−pij)=α+xijβ+ηj
これはまさにロジスティック混合効果モデルです。したがって、ロジスティックモデルは上記で指定した潜在変数モデルと同等です。重要な注意事項:
- のスケールは識別されません。定数でスケールダウンする場合、上記を単に、Sεijs
exp{−(α+xijβ+ηj)/s}1+exp{−(α+xijβ+ηj)/s}
したがって、係数と変量効果は、対応する量によって単純にスケールアップされます。したがって、が使用されます。これはを意味します。
s=1var(εij)=π2/3
ここで、このモデルを使用してから数量
σ^2ησ^2η+π2/3
潜在的な潜在変数のクラス内相関を推定します。別の重要な注意事項:
- 場合はとして指定され、代わりに、標準正規分布を持つ、あなたは混合効果を持っているモデルをプロビット。その場合、は、ランダムに選択された2つの瞳孔間の四倍相関を推定します。同じ学校で、基礎となる連続データが正規分布したときにピアソン(1900年頃)によって統計的に識別されることが示されました(この研究では、これらの相関関係がバイナリケースから複数カテゴリケースまで識別され、これらの相関がポリコリック相関と呼ばれます)。εij
σ^2ησ^2η+1
このため、バイナリデータの(四分の一)クラス内相関の推定に主な関心がある場合は、プロビットモデルを使用することをお勧めします(これが推奨です)。
リンクした論文に記載されている他の方法について:
(A)線形化の方法を見たことはありませんが、1つの欠点は、これによって生じる近似誤差の兆候がないことです。さらに、モデルを(潜在的に粗い近似により)線形化する場合、最初に線形モデルを使用しないのはなぜですか(たとえば、オプション(C)、これについては後で説明します)。また、ICCは依存するため、表示するのがより複雑になります。xij
(B)シミュレーション手法は統計学者にとって直感的に魅力的です。なぜなら、データの元のスケールでの推定分散分解が得られるからです。しかし、聴衆によっては、(i)これを「手法」で記述するのは複雑かもしれませんセクション(ii)「より標準的な」何かを探していたレビュアーをオフにすることができます
(C)データが連続しているふりをすることは、おそらく素晴らしいアイデアではありませんが、ほとんどの確率が0または1に近すぎない場合、ひどく動作しません。しかし、これを行うと、ほぼ間違いなくレビュー担当者に赤旗が上がります。だから私はとどまるだろう。
ついに、
(2)固定効果が長年にわたって非常に異なる場合、それらは異なるスケールにある可能性があるため、長年にわたる変量効果の分散を比較することは困難であると考えるのが正しいでしょう(これは非識別可能性に関連しています)上記のスケーリングの問題の)。
一定の効果を時間とともに維持したい場合(ただし、時間の経過とともに大きく変化する場合は、そうしたくない場合があります)、ランダム効果の分散の変化を確認するには、ランダムを使用してこの効果を調べることができます勾配とダミー変数。たとえば、ICCが異なる年に異なるかどうかを確認したい場合、観測が年行われた場合は、そうでない場合は0にして、線形予測子を次のようにモデル化します。私k= 1k
α + x私はjβ + η1jI1+η2jI2+η3jI3+η4jI4+η5jI5+η6jI6
これにより、毎年異なるICCが得られますが、同じ固定効果が得られます。時間内にランダムな勾配を使用するだけで、線形予測子を作成したくなるかもしれません
α+xijβ+η1+η2t
しかし、これはお勧めしません。それは、関連付けが時間とともに増加するだけで、減少しないためです。