多くの入力変数を使用する場合、しばしば多重共線性が懸念されます。多重共線性の検出、考察、および/または通信に使用される多重共線性の尺度は多数あります。一般的な推奨事項は次のとおりです。
- 特定の変数 の複数の
- 特定の変数 の許容誤差
- 特定の変数 の分散インフレーション係数、
設計マトリックス全体の条件番号:
(ウィキペディアの記事で議論されている他のいくつかのオプションがあり、RのコンテキストでSOがあります。)
最初の3つがお互いの完全な機能であるという事実は、それらの間の唯一の可能な純利益が心理的であることを示唆しています。一方、最初の3つの方法では変数を個別に調べることができます。これは利点かもしれませんが、条件番号の方法が最適であると聞いています。
- これは本当ですか?何に最適?
- 条件数はの完全な関数ですか?(そうなると思います。)
- そのうちの1つが説明が最も簡単だと人々は思いますか?(これらの数値をクラス外で説明しようとしたことは一度もありません。多重共線性のゆるくて定性的な説明をします。)
私はそれに対する答えがここに既にあるものを補うことで、質問まで、関連のフォローを掲載している:stats.stackexchange.com/questions/173665/...
—
キレニア