マルチレベル/階層設計で非ランダム因子をランダムとしてモデル化できますか?


9

厳密にランダムな変数(そのようにモデル化する必要がある)と、階層/マルチレベルモデルの場合にランダムとしてモデル化できると主張する非ランダム変数の違いは、私には不明瞭です。

BatesとBolkerは、ランダムに選択されたサンプルの製品の品質など、真のランダム性の場合のランダム効果を例示します。彼らのlme4仕事はすごいですが、線がランダムとランダムではないところがどこにあるのかはまだはっきりしていません。社会科学での議論は、これをさらに不明瞭にします。マルチレベル/階層モデルと変量効果モデルはで計算上等しいlme4ので、どこに線を引くのでしょうか。

たとえば、私は複数の個人で反復測定のデータセット(ランダムです!)を持っていますが、私は、lme4分散の大部分が社会経済変数(居住地域、人種など)内にあると考えており、その結果を示しています。これらの変数はランダムではありませんが、マルチレベルモデルはこれらをそのまま使用できると主張しています。他の例は、学生の学年の研究から来ています。通常、学生を教師内に、さらには学校内に入れ子にしています。これらの変数はすべて定数です。

マルチレベル(階層)モデルの領域で妥当である場合、非ランダム因子をランダムとしてモデル化できますか?


ここを参照してください:stats.stackexchange.com/questions/4700/...
ティム


こんにちはティム。リンクに感謝しますが、実際には質問には答えません。ランダム効果、混合効果、固定効果の意味を理解しています。この問題は、マルチレベル/階層設計で、非ランダム変数をランダムとして組み込むことができるかどうかです。
Adam Robinsson、2015年

回答:


14

私はあなたの質問に戸惑っています。固定効果と変量効果を理解していると言われていますが、おそらく私と同じようには理解していません。私の見解を説明するプレス内の本の章からのかなり拡張された抜粋をここに投稿しました(むしろ実用的で、Andrew Gelmanのものとかなり密接に整合しています)。

より直接質問に答える:

  • 収入などの社会経済変数の主な影響をランダムに含めることは(IMO)意味がありません。 場合あなたは、個々の一人当たりの収入の2つ以上の測定値を持っていた、あなたは、グループ化変数として個々含めると応答への収入の影響は(それが何であれ)、個人間で変化することができる可能性があります。
  • 人種は固定効果として最も理にかなっているようであり、複数の人種の影響下で個人を測定できる可能性は低いですが、(たとえば)効果のランダムな変動を特徴付けることができるかもしれませんさまざまな国の人種です。あなたは可能性があり、ランダムな効果として、それを扱う(つまり、モデルの正規分布から引かれるよう人種間の相違)が、それはおそらくあなたはおそらく、あなたのデータセットに十分な異なる人種を持っていないので、非現実的であるためには、それがために難しいだろうですこれについて良い概念的な議論を思いつくために私は...
  • 「生活圏」はグループ化変数として意味があり、これは確かに合理的なランダム効果である可能性があります(つまり、切片は生活圏によって異なります)。個人は、研究の時間スケールで領域間を移動しない限り、おそらく領域内にネストされます。
  • あなたの状況は、個人間でランダムな変動がある場合のようですが、個人レベルの共変量もあります。これらの個人レベルの共変量(人種、収入など)をモデルに追加すると、個人間の変動の一部が説明されます(おそらく良いアイデアです)。

それは区別するために明確さを追加することがグループ化変数物事が変化する間でグループを表す(カテゴリでなければならない)、およびエフェクトいくつかのパラメータ/エフェクト(通常切片では違いがあり、しかし、収入の影響かもしれません/教育/何でも)いくつかのグループ化変数のレベル全体。

更新:私はあなたにいくつかの対置を与える自由をとります

ランダム効果についての私の理解:母集団からランダムに選択された因子。

  • たぶん、それはあなたの哲学的な見方次第です。これ古典的な常習主義のパラダイムで必要ですが、架空の母集団からのランダムな描画として効果を処理するのが妥当かどうかを尋ねることで多少緩和します。(ここでの典型的な例は、(1)徹底的なサンプリングです(都市のすべての近隣、または国のすべての地域/地方/州の測定値がある場合はどうでしょうか?それでも、それらをいくつかの超母集団からのランダムな抽選として扱うことができますか?および(2 )順次測定される期間(例:2002-2012年)これらのケースの両方で、ランダム効果を使用してモデル化することは実用的であると言えます。)

因子のレベルにはほとんど関心がありません。

  • 必ずしも。変量効果は迷惑変数でなければならないという考えは実際には成り立たないと思います。たとえば、動物の繁殖分析では、特定の動物の繁殖価値(BLUP)を知ることに非常に関心があります。(いわゆる焦点のレベルは、モデルの比較方法に何らかの影響を及ぼします。)

変数は観察されない要因です。

これが何を意味するのか分かりません。それぞれの観測がどの地域から来ているか知っていますよね?それはどのように「観察されない」のですか?(観測されていない要因に基づいてデータのクラスタリングが疑われる場合は、離散混合モデルを適合させる必要があります。)近傍が異なる理由がわからない場合は、ここでは重要ではないと思います。

例として近所を見てください。それは私の主要な変数であり、レベルは重要です。私は混合モデルを使用し、その中に大きな変動があることを確認しています。

近傍をランダムな効果として使用しないと考えることができる唯一の理由は、少数(たとえば<6)の近傍のみを測定した場合です。


ランダム効果についての私の理解:母集団からランダムに選択された因子。因子のレベルにはほとんど関心がありません。変数は観察されない要因です。例として近所を見てください。それは私の主要な変数であり、レベルは重要です。私は混合モデルを使用し、その中に大きな変動があることを確認しています。あなたはそれが確率変数として使われるかもしれないと述べました。そのため、非ランダム変数をランダムとしてモデル化します。これはやや混乱を招きますが、あなたの答えはこれにいくつかの光を投げかけます。抜粋をすぐに読みます。答えてくれてありがとう、ありがとう。
Adam Robinsson、2015年

残念ながら、今のところ、Bolker教授まで更新に気づきませんでした。私は実際にそれを手に入れました。それは超単純なものではなく、全体の混合モデルの概念であり、理解するのに少し時間がかかると思います。確かに似たような質問がたくさんあるので、私だけではないでしょう。それにもかかわらず、明確な答えをありがとう。感謝。
Adam Robinsson、2015年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.