ツインスタディデータによる線形混合効果モデリング


14

i番目の家族のj番目の兄弟から測定されたいくつかの応答変数yijがあるとします。さらに、各被験者からいくつかの行動データx i jが同時に収集されました。次の線形混合効果モデルを使用して状況を分析しようとしています。jixij

yij=α0+α1xij+δ1ixij+εij

ここで、α0α1、それぞれ固定切片と傾きであり、 δ1iランダム傾きであり、εij残差です。

ランダム効果のための前提条件は、δ1i及び残留εij(各ファミリー内の2つだけの兄弟が存在すると仮定されます)

δ1idN(0,τ2)(εi1,εi2)TdN((0,0)T,R)

ここで、未知の分散パラメータであり、分散共分散構造Rは、フォームの2×2対称行列でありますτ2R

(r12r122r122r22)

2人の兄弟間の相関関係をモデル化します。

  1. これは、そのような兄弟研究に適したモデルですか?

  2. データは少し複雑です。50の家族のうち、90%近くが二卵性(DZ)双生児です。残りの家族のために、

    1. 2人は兄弟が1人だけです。
    2. 2つには1つのDZペアと1つの兄弟があります。そして
    3. 2つには1つのDZペアと2つの追加の兄弟があります。


    lmeRパッケージnlmeは、(1)不足または不均衡な状況でも簡単に処理できると考えています。私の問題は、(2)と(3)の対処方法です。私が考えることができる1つの可能性は、各サブファミリーが1つまたは2つの兄弟を持つように(2)および(3)のこれらの4つのファミリーのそれぞれを2つに分割して、上記のモデルを適用できるようにすることです。これでいいですか?もう1つの選択肢は、(2)と(3)の余分な1つまたは2つの兄弟からデータを単に破棄することです。これは無駄であると思われます。より良いアプローチはありますか?

  3. たとえば、r 2 12 = 0.5のように、残差分散共分散行列Rlme値を修正できるようです。相関構造を課すことは理にかなっていますか、それとも単にデータに基づいて推定する必要がありますか?rRr122


1
は何を意味しますか?xj
マクロ

@Macro:それを見つけてくれてありがとう。OPを変更して、が各兄弟の動作変数である説明変数であることを示すようにしました。xij
ブルーポール

1
非常に興味深い質問と応用。私は何かを見逃しているかもしれませんが、このモデルは過剰にパラメーター化されているようです。相関誤差は効果的に「非共有」構成要素と同様の機能を有する後者は「共有」コンポーネントに因数分解することができるδ 0 iは。あなたはどちらか削除する必要がありますδ 0 私が作る、εのIIDエラーを、等の制約課すR 2 12 = 0.5を識別可能のために-あなたは相関関係を兄弟に、環境/遺伝的要素を分離する目的であることをやっていますか?ϵi1,ϵi2δ0iδ0iϵr122=.5
マクロ

@macro:あなたがしている右:モデルでは必要ありません。これを指摘してくれてありがとう!奇妙なことに、そのような冗長性について文句を言うことはありません。δ0ilme
ブルーポール

このオーバーパラメーター化されたモデルを引き続き使用していますか(質問の一部は編集されていません)?
マクロ

回答:


10

ダミー変数を使用し、そのダミー変数にランダムな勾配を含めることで、双子と非双子を統合モデルに含めることができます。すべてのファミリには最大で1組の双子がいるため、これは比較的単純です。

してみましょうI J = 1を兄弟場合jの家族の中では、私は双子で、そうでなければ0。含まれていない、いない場合は-私はあなたにもランダムな傾斜が通常の兄弟対双子のために異なるしたいと仮定していη I 3以下のモデルで用語を。Aij=1jiηi3

次に、モデルを近似します。

yij=α0+α1xij+ηi0+ηi1Aij+ηi2xij+ηi3xijAij+εij
  • あなたのspecifiationのように、効果が固定されています。α0,α1

  • 「ベースライン」ランダム効果を兄弟であり η I 1は、双子が正規同胞よりも類似することを可能にする追加のランダム効果であるが。対応する変量効果の分散のサイズは、兄弟が似ているかどうか、および通常の兄弟よりも似ている双子がどれだけ多いかを定量化します。双子相関と非双子相関の両方がこのモデルによって特徴付けられていることに注意してください-双子相関はランダム効果を適切に合計することで計算されます(プラグイン A i j = 1)。ηi0ηi1Aij=1

  • η I 3は、類似した役割を持っている、唯一の彼らはのランダムな斜面として機能 X I Jηi2ηi3xij

  • IID誤差項である-私はランダムインターセプトではなく、相関残留誤差の面で少し異なるモデルを書かれていることに注意してください。εij

Rパッケージを使用してモデルを近似できますlme4。従属変数以下のコードでありy、ダミー変数でありA、予測がされx、ダミー変数及び予測の積であるAxfamID家族のための識別番号です。データはD、これらの変数を列としてデータフレームに格納されると想定されています。

library(lme4) 
g <- lmer(y ~ x + (1+A+x+Ax|famID), data=D) 

と入力すると、変量効果変数と固定効果の推定値を表示できますsummary(g)。このモデルでは、ランダム効果を互いに自由に相関させることができます。

多くの場合、ランダム効果間の独立性を仮定する方が理にかなっている(または、より簡単に解釈できる)場合があります(たとえば、この仮定は多くの場合、遺伝と環境の家族相関を分解するために行われます)。

g <- lmer(y ~ x + (1|famID) + (A-1|famID) + (x-1|famID) +(Ax-1|famID), data=D) 

これは本当に素晴らしい解決策であり、私はそれが好きです!すぐにそれを試してみて、それが行くのを見てください...どうもありがとう!
ブルーポール

どういたしまして。この解決策が役立つと思ったら、答えを受け入れることを検討してください:)
マクロ

2つの問題:1)ほとんどの被験者は二卵性双生児なので、あなたのアプローチはDZ双子のペア間の相関をモデル化していないようです。2)余分な兄弟を持つ家族は4人だけです。私は、これらの4つの家族だけに基づいて兄弟の変量効果を推定することは難しいと心配しています。DZ双子のペアと別の兄弟の違いは比較的小さいため(主に環境ではなく遺伝的)、双子と兄弟の微妙な違いを単純に無視し、モデルのようにランダムな効果を持つ双子としてそれらの少数の兄弟を扱うことができますまたは私のOPのように相関残差で。
ブルーポール

このアプローチは、双子間の相関をモデル化します。それらの予測値が0である場合、例えば、その双子の間に相関があるここでσ20σ21の分散されたηI0ηI1はそれぞれ、及びσ2ε誤差項の分散です。予測値が0でない場合、この式には他の2つのランダム効果の分散も含まれます。
σ02+σ12σ02+σ12+σε2
σ02,σ12ηi0,ηi1σε2
マクロ

ηi0ηi2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.