パッケージのvif()方法を使用carして、モデルの入力の多重共線性の程度を計算できることを学びました。ウィキペディアから、vif値がそれより大きい場合5、入力が多重共線性の問題に苦しんでいると考えることができます。たとえば、私はlm()メソッドを使用して線形回帰モデルを開発し、vif()次のように与えます。私たちが見ることができるように、入力はub、lb、およびtb多重共に苦しんでいます。
vif(lrmodel)
tb ub lb ma ua mb sa sb
7.929757 50.406318 30.826721 1.178124 1.891218 1.364020 2.113797 2.357946
多重共の問題を回避するため、私のモデルをより堅牢にするためには、私は間の相互作用をとっているubとlb、今の新しいモデルのテーブルVIFは次のとおりです。
tb ub:lb ma mb sa sb ua
1.763331 1.407963 1.178124 1.327287 2.113797 1.860894 1.891218
R^2上記の2つのケースでは、値に大きな違いはなく、1脱退CVテストのエラーにも大きな違いはありません。
私の質問は:
上記のような相互作用を取ることで多重共線性の問題を回避することは問題ありませんか?
上記のvifメソッドの結果と比較して、多重共線性の問題を提示するより良い方法はありますか。
提案をお願いします。
ありがとう。