バイナリデータとの相関における分散分割と縦方向の変化


14

ロジスティック線形混合効果モデル(ランダムインターセプト)を使用して、175校の300,000人の生徒に関するデータを分析しています。各生徒は1回だけ発生し、データは6年間に及びます。

  1. 継続的な成果のためにVPC / ICCと同様の方法で、学校レベルと生徒レベル間の分散をどのように分割しますか?私は4つの方法を提案するこの記事を見てきましたが、そのうちAとBは私にとって興味深いものですが、これらのいずれかを使用することでどのような利点/欠点があるか、そしてもちろん他の方法があるかどうかを知りたいですそれ。

  2. 年ごと(または他の期間)の学校レベルの残差をどのように比較できますか?これまでのところ私は年によってデータを分割し、データの各年に対するモデルを実行することによって、これを行っているが、私はので、これは欠陥があると思う:私は)私はによって分割すべき理由は明白な理由がない年は、ii)固定効果の推定値は年ごとに異なるため、年ごとの変量効果の比較は意味をなさない場合があります(これは私の直感であり、誰かがこれをより正式に説明できれば正しいと思います)。

注:whuberおよびMacroとのメタでの議論の後、この質問を書き直しました。


3
これは大きな改善だと思います。問題は非常に明確になりました。現時点では、きちんと整理された対応をする時間はありませんが、後で回答を投稿します。
マクロ

3
ロジスティック混合効果モデルは、高校にとって非常に高度なトピックのようです。彼らはあなたの高校のシラバスの一部ですか、それとも独立して勉強していますか?
mark999

4
@ mark999私は独立して勉強しています。実際、私は「これを理解する方法はない」と言った弟の間違いを証明しようとしています。彼は統計学の学位を取得しているので、私は彼のすべての本などにアクセスできます(彼がいいとき)。
ジョーキング

回答:


15

してみましょう学生の応答との予測ベクトルを表す(それぞれ)学校で。 iyij,xijij

(1)バイナリデータの場合、連続データの場合と同様の分散分解を行う標準的な方法は、作成者がリンクでメソッドDと呼びます(以下の他のメソッドについてコメントします)-バイナリデータを線形モデルによって支配され、その潜在スケールの分散を分解する基礎となる連続変数から生じる。その理由は、ロジスティックモデル(およびその他のGLM)が自然にこのように発生するためです。

これを確認するには、定義 して、線形混合モデルによって管理されるようにします。yij

yij=α+xijβ+ηj+εij

ここで、は回帰係数、は学校レベルのランダム効果、は残差分散項であり、標準ロジスティック分布を持ちます。さあη JN 0 σ 2ε I Jα,βηjN(0,σ2)εij

yij={1if   yij00if   yij<0

せ今、単に我々はロジスティックCDFを使用してpij=P(yij=1|xij,ηj)

pij=1P(yij<0|xij,ηj)=exp{(α+xijβ+ηj)}1+exp{(α+xijβ+ηj)}

今服用ロジット変換両側の、あなたが持っています

log(pij1pij)=α+xijβ+ηj

これはまさにロジスティック混合効果モデルです。したがって、ロジスティックモデルは上記で指定した潜在変数モデルと同等です。重要な注意事項:

  • のスケールは識別されません。定数でスケールダウンする場合、上記を単に、Sεijs

exp{(α+xijβ+ηj)/s}1+exp{(α+xijβ+ηj)/s}

       したがって、係数と変量効果は、対応する量によって単純にスケールアップされます。したがって、が使用されます。これはを意味します。
      s=1var(εij)=π2/3

ここで、このモデルを使用してから数量

σ^η2σ^η2+π2/3

潜在的な潜在変数のクラス内相関を推定します。別の重要な注意事項:

  • 場合はとして指定され、代わりに、標準正規分布を持つ、あなたは混合効果を持っているモデルをプロビット。その場合、は、ランダムに選択された2つの瞳孔間の四倍相関を推定します。同じ学校で、基礎となる連続データが正規分布したときにピアソン(1900年頃)によって統計的に識別されることが示されました(この研究では、これらの相関関係がバイナリケースから複数カテゴリケースまで識別され、これらの相関がポリコリック相関と呼ばれます)。εij
    σ^η2σ^η2+1
    このため、バイナリデータの(四分の一)クラス内相関の推定に主な関心がある場合は、プロビットモデルを使用することをお勧めします(これが推奨です)。

リンクした論文に記載されている他の方法について:

  • (A)線形化の方法を見たことはありませんが、1つの欠点は、これによって生じる近似誤差の兆候がないことです。さらに、モデルを(潜在的に粗い近似により)線形化する場合、最初に線形モデルを使用しないのはなぜですか(たとえば、オプション(C)、これについては後で説明します)。また、ICCは依存するため、表示するのがより複雑になります。xij

  • (B)シミュレーション手法は統計学者にとって直感的に魅力的です。なぜなら、データの元のスケールでの推定分散分解が得られるからです。しかし、聴衆によっては、(i)これを「手法」で記述するのは複雑かもしれませんセクション(ii)「より標準的な」何かを探していたレビュアーをオフにすることができます

  • (C)データが連続しているふりをすることは、おそらく素晴らしいアイデアではありませんが、ほとんどの確率が0または1に近すぎない場合、ひどく動作しません。しかし、これを行うと、ほぼ間違いなくレビュー担当者に赤旗が上がります。だから私はとどまるだろう。

ついに、

(2)固定効果が長年にわたって非常に異なる場合、それらは異なるスケールにある可能性があるため、長年にわたる変量効果の分散を比較することは困難であると考えるのが正しいでしょう(これは非識別可能性に関連しています)上記のスケーリングの問題の)。

一定の効果を時間とともに維持したい場合(ただし、時間の経過とともに大きく変化する場合は、そうしたくない場合があります)、ランダム効果の分散の変化を確認するには、ランダムを使用してこの効果を調べることができます勾配とダミー変数。たとえば、ICCが異なる年に異なるかどうかを確認したい場合、観測が年行われた場合は、そうでない場合は0にして、線形予測子を次のようにモデル化します。k=1k

α+xijβ+η1jI1+η2jI2+η3jI3+η4jI4+η5jI5+η6jI6

これにより、毎年異なるICCが得られますが、同じ固定効果が得られます。時間内にランダムな勾配を使用するだけで、線形予測子を作成したくなるかもしれません

α+xijβ+η1+η2t

しかし、これはお勧めしません。それは、関連付けが時間とともに増加するだけで、減少しないためです。


この分散パーティション手法に関するリンクされた記事のポイントに対処するためのコメントをお願いします。「(0、1)応答は、たとえば、連続的なマークスケールに基づいた合格/不合格の応答ですが、死亡率や投票など、応答が本当に離散的である場合、正当性が低くなるようです。私の場合、後者のカテゴリに分類されるいじめの発生率を扱っています。
Joe King

@JoeKing、ロジスティック/プロビット(および同様の)回帰モデルは、データが基礎となる連続体から生成されるとすでに仮定していると言えます。したがって、そのようなモデルを使用している場合でも、その仮定を防御可能であると判断する必要があります:)
マクロ

1
@JoeKing、この回答が決定的だと思う場合は、受け入れることを検討してください:)
マクロ

なるほど。現時点では、いくつかの点について少し不確かなので、少し読んで少しの時間(数日)があり、データをもう少し見てから、また戻ってきたいと思います。気にしないなら?
ジョーキング

もちろん@JoeKing -私はそのアウトを指し示すだろう、私は思ったので、いくつかの新しいメンバーが、気づいていない-それは、すべての場所の圧力あなたに意味されていなかった
マクロ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.