研究者やデータアナリストによる主観的な選択であるという、微妙な、そしておそらく満足のいく答えが得られないかもしれません。このスレッドの他の場所で述べたように、データが「ネストされた構造」を持っていると単純に言うだけでは十分ではありません。しかし、公平を期すために、これはマルチレベルモデルを使用する場合について説明している本の数です。たとえば、私は本棚からJoop Hoxの本Multilevel Analysisを引き出しただけで、次のように定義されています。
マルチレベルの問題は、階層構造を持つ人口に関係しています。
かなり良い教科書でさえ、最初の定義は循環しているようです。これは、どのようなモデル(マルチレベルモデルを含む)をいつ使用するかを決定する主観性に一部起因していると思います。
別の本、West、Welch、およびGaleckiのLinear Mixed Modelsは、これらのモデルは以下のものを対象としていると述べています。
残差が正規分布しているが、独立していない、または一定の分散を持たない結果変数。LMMを使用して適切に分析できるデータセットにつながる研究デザインには、(1)教室の学生などのクラスター化されたデータを使用した研究、または産業プロセス用の原材料のバッチなどのランダムブロックを使用した実験デザイン、および(2)縦断的または反復測定研究。被験者は経時的に、または異なる条件下で繰り返し測定されます。
Finch、Bolin、およびKelleyのRのマルチレベルモデリングでも、iidの仮定および相関残差の違反について説明しています。
マルチレベルモデリングのコンテキストで特に重要なのは、サンプル内の個々の観測値の独立して分布した誤差項の[標準回帰における]仮定です。この仮定は本質的に、分析の独立変数が考慮されると、従属変数のサンプル内の個人間には関係がないことを意味します。
観測値が必ずしも互いに独立しているとは限らないと考える理由がある場合、マルチレベルモデルは理にかなっていると思います。この非独立性を説明する「クラスター」が何であれ、モデル化できます。
明白な例は、教室の子供です。彼らはすべて互いに相互作用しているため、テストのスコアが独立していない可能性があります。1つの教室に、他のクラスではカバーされていないそのクラスでカバーされている資料につながる質問をする人がいる場合はどうなりますか?一部のクラスで教師が他のクラスよりも目覚めている場合はどうなりますか?この場合、データにはある程度の非依存性があります。マルチレベルの単語では、従属変数の分散はクラスター(つまり、クラス)によるものであると予想できます。
犬と象の例は、関心のある独立変数と従属変数に依存していると思います。たとえば、活動レベルにカフェインの影響があるかどうかを尋ねているとします。動物園中の動物たちがランダムに割り当てられ、カフェイン入りの飲み物か対照の飲み物をもらいます。
カフェインに関心のある研究者であれば、カフェインの影響に本当に関心があるため、マルチレベルモデルを指定することができます。このモデルは次のように指定されます。
activity ~ condition + (1+condition|species)
これは、この仮説をテストする種が多数ある場合に特に役立ちます。しかし、研究者はカフェインの種固有の効果に興味があるかもしれません。その場合、種を固定効果として指定できます。
activity ~ condition + species + condition*species
たとえば30種があり、扱いにくい2 x 30のデザインを作成している場合、これは明らかに問題です。ただし、これらの関係をどのようにモデル化するかで、かなり創造的になることができます。
たとえば、何人かの研究者は、マルチレベルモデリングのさらに幅広い使用を主張しています。Gelman、Hill、およびYajima(2012)は、データの構造が本質的に明らかに階層的ではない実験的研究においても、マルチレベルモデリングを複数の比較の修正として使用できると主張しています。
より多くの構造を持つ複数の比較をモデル化すると、より難しい問題が発生します。たとえば、5つの結果指標、3つの種類の治療法、および2つの性別と4つの人種グループによって分類されたサブグループがあるとします。この2×3×4×5の構造を、120個の交換可能なグループとしてモデル化したくありません。これらのより複雑な状況でも、マルチレベルモデリングは従来の多重比較手順に取って代わるべきであり、最終的にはそうなると私たちは考えています。
問題はさまざまな方法でモデル化でき、あいまいな場合は、複数のアプローチが魅力的であるように見える場合があります。私たちの仕事は、合理的で情報に基づくアプローチを選択し、それを透過的に行うことだと思います。