ネストされた変量効果項の数学的表現


8

依存レベルの変数と仮定し単位レベル型のユニット内にネストされている(レベル1)で測定された(レベル)、及び型のユニットAは、型のレベル内にネストされているB(レベル3)。yA2AB3

次の式を当てはめたとします。

y ~ "FIXED EFFECTS [my syntax]" + (1 + x | B/A)

ここで、xはレベル1の予測子1です。

私の理解では、そのような数式の数学的表現は次のとおりです。それが正しいか?


以下では、yb,a,iの出力であるi部で番目のデータポイントaA部にネストbB。このデータポイントには、対応する予測子xb,a,iます。

yb,a,i=“fixed effects''+ub+ub,1,a+(βb+βb,1,a)x

どこ

ubN(0,σB)

ub,1,aN(0,σ)

βbN(0,ρB)

βb,aN(0,ρ)

つまり、はレベル全体で変化する標準偏差の項です。一方、任意の、レベルユニット、及び、レベルに含まれるユニット、その後の標準偏差の用語である。つまり、はどのレベルユニットでも定数です。σB3b3a2aσσ2


これは正しいですか(「線形混合モデル:統計ソフトウェアを使用した実践ガイド」の136ページにある関連プレゼンテーションから推測することで、この推論に基づいています)?これが正しい場合、データポイントが属するレベルのユニットに依存させる方法はありますか。σA

回答:


4

数式にランダムな効果がないと思います。応答は、固定効果+ 5つのコンポーネントを持つエラー項に依存します。yiab

εiab+εa|b+εb+xβab+xβb

順に、これらのコンポーネントは左から右に次のように解釈されます。

  1. 純粋なエラー(各観測に個人的な)
  2. 共通のBレベル内のAのさまざまなレベルによる変動
  3. Bのさまざまなレベルによる変動
  4. 共通のレベルBが与えられた場合、Aが関係の傾きにどのように影響するかx
  5. レベルBがの勾配に与える影響x

をAのレベルで変化させることはできません。モデルが識別できなくなるためです(パラメーターが多すぎて、すべて同じジョブを実行するため)。そうでない場合を除いて、変動は既知の重み(グループ数など)に依存します。その場合でも、パラメーターの数は同じになります。A(またはB)のレベルの値はわからないが、固定分散の仮定の下でそれらを推定することを覚えておいてください。ここでは、ある種の規則性を想定する必要があります。σ

編集:@Amoebaはこれに疑問を投げかけ、観察の分散の異なる値の可能性について誤解された可能性があります。実際、OPの質問を読み間違えました。私は隠れた影響の分散について考えていましたが、個々の観測の純粋な誤差ではありませんでした。AレベルとBレベルはランダムであるため、おそらく分散もランダム効果と見なす必要があります。つまり、AレベルとBレベル自体のランダム効果の場合と同様に、それらを推定する際にある種の正則化を適用する必要があります。α

ひどくなる。混合効果モデルの価値は、テストされていない状況(モデルにAとBのレベルが含まれていない)の信頼区間を形成できることです。したがって、分散に分布を配置し、それに応じて信頼区間を調整する必要があります。 。それはかなり醜く聞こえます。

そして、確かに、分散と平均の推定について話しているので、これがうまく機能するには多くのデータが必要になります。

ウェルチ検定に関しては、これは基本的にベーレンス・フィッシャー問題と呼ばれていたものに適用されるクラッジです-分散が等しくない場合の2つの平均の差を検定する問題。メモリが機能する場合、問題は、固定次元の十分な統計がないことです。

私にとって、問題はなぜその問題が意味のある解決策を認めるべきなのかということです。分散が等しくない場合、比較とは実際にはどういう意味ですか?車の2つのモデルを想像してみてください。モデルAの自動車は、通常、毎年限られた数の修理が可能です。モデルBの車は、レモンである場合もあれば、優れている場合もあります。この場合、所有権の平均コストを比較するとはどういう意味ですか?しかし、レベルの分散が変化することが許されるとき、それは私たちが話していることです。分散が変化することが許されている場合、平均を比較することは実際にはどのくらい意味がありますか?リンゴとオレンジを比較していることを示しています。

参照。このためにRを使用しているように見えるため、Rのnlmeおよびlme4パッケージのコードを記述しているため、BatesとPinheiroの本「S-plusの混合効果モデル」を読むことをお勧めします。その本はあなたがおそらく必要とするかもしれないすべての詳細に行きます。それらは、共通のレベルを持つ観測間の相関を可能にします。


1
分散がグループ化変数によって変化することが許可されている場合、モデルが識別できないのはなぜですか?それは、(1は、いくつかのハッキングとlme4でさえ、コード、見ることができるウェルチのt検定のようではありませんstats.stackexchange.com/a/144480/28666を)?
アメーバ2018年

@amoebaありがとう。あなたは正しいです。私は質問を誤解し、それが分布の各レベルの異なる分散を参照していると考えました。α
Placidia
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.