現在、いくつかの混合効果線形モデルを実行しています。
Rでパッケージ「lme4」を使用しています。
私のモデルの形式は次のとおりです。
model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect))
モデルを実行する前に、予測子間の可能な多重共線性をチェックしました。
私はこれをしました:
予測子のデータフレームを作成します
dummy_df <- data.frame(predictor1, predictor2)
「cor」関数を使用して、予測子間のピアソン相関を計算します。
correl_dummy_df <- round(cor(dummy_df, use = "pair"), 2)
「correl_dummy_df」が0.80より大きい場合、predictor1とpredictor2の相関が高すぎるため、モデルに含まれていないと判断しました。
読書を行うと、多重共線性をチェックするより客観的な方法が現れます。
誰にもこれに関するアドバイスはありますか?
「Variance Inflation Factor(VIF)」は、1つの有効な方法のようです。
VEDは、AEDパッケージ(非クラン)の関数「corvif」を使用して計算できます。パッケージはhttp://www.highstat.com/book2.htmにあります。このパッケージは、次の書籍をサポートしています。
Zuur、AF、Ieno、EN、Walker、N.、Saveliev、AA&Smith、GM2009。混合効果モデルとエコロジーの拡張、R、第1版。スプリンガー、ニューヨーク。
一般的な経験則のように見えますが、VIFが5より大きい場合、予測子間の多重共線性は高くなります。
VIFの使用は、単純なピアソン相関よりも堅牢ですか?
更新
興味深いブログを見つけました:
http://hlplab.wordpress.com/2011/02/24/diagnosing-collinearity-in-lme4/
ブロガーは、lme4パッケージのモデルのVIFを計算するための便利なコードを提供します。
コードをテストしましたが、うまく機能します。その後の分析で、モデルの多重共線性は問題ではないことがわかりました(すべてのVIF値<3)。これは、以前にいくつかの予測子間の高いピアソン相関関係を発見したことを考えると、興味深いものでした。
http://highstat.com/Books/BGS/GAMM/RCodeP2/HighstatLibV6.R
AED
パッケージは廃止されました。代わりに、機能のsource("http://www.highstat.com/Book2/HighstatLibV6.R")
ためだけ にcorvif
。(2)本当の答えを提供したいが、(a)VIFは多重共線性を考慮に入れていると思う)および(b)共線性の用語を削除することの知恵について、私は強い遠慮があります。グラハム参照エコロジー 2003、DOI:10.1890 / 02から3114