タグ付けされた質問 「vif」

6
最新の統計/機械学習で多重共線性がチェックされないのはなぜですか
従来の統計では、モデルの構築中に、分散インフレーション係数(VIF)の推定などの方法を使用して多重共線性をチェックしますが、機械学習では、代わりに特徴選択に正則化を使用し、特徴が相関しているかどうかをチェックしないようですまったく。なぜそうするのですか?

3
どの分散インフレ率を使用する必要があります:または?
vifRパッケージの関数を使用して、分散インフレ率を解釈しようとしていますcar。この関数は、一般化されたと両方を出力し。ヘルプファイルによると、この後者の値VIFVIF\text{VIF}GVIF1 /(2 ⋅ DF )GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} 信頼楕円体の次元を調整するために、関数はGVIF ^ [1 /(2 * df)]も出力します。ここで、dfは項に関連付けられた自由度です。 ヘルプファイルでこの説明の意味がわからないため、またはを使用すべきかどうかわかりません。私のモデルのためにこれらの2つの値が非常に異なっている(最大〜ある、最大値は〜ある)。GVIFGVIF\text{GVIF}GVIF1 /(2 ⋅ DF )GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})}GVIFGVIF\text{GVIF}606060GVIF1 /(2 ⋅ DF )GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})}333 誰かが私にどれを使用すべきか、そして信頼楕円体の次元を調整することの意味を教えてください。

2
相互作用項が含まれる場合にのみ問題となる共線性診断
米国の郡で回帰分析を実行し、「独立」変数の共線性をチェックしています。Belsley、Kuh、およびWelschの回帰診断では、Condition IndexおよびVariance Decomposition Proportionsを調べることを推奨しています。 library(perturb) ## colldiag(, scale=TRUE) for model with interaction Condition Index Variance Decomposition Proportions (Intercept) inc09_10k unins09 sqmi_log pop10_perSqmi_log phys_per100k nppa_per100k black10_pct hisp10_pct elderly09_pct inc09_10k:unins09 1 1.000 0.000 0.000 0.000 0.000 0.001 0.002 0.003 0.002 0.002 0.001 0.000 2 3.130 0.000 0.000 0.000 0.000 0.002 0.053 0.011 …

2
VIF、条件インデックスおよび固有値
現在、データセットの多重共線性を評価しています。 問題を示唆するVIFのしきい値と条件インデックスはどのくらいですか? VIF: 私はVIFと聞いてい問題です。≥10≥10\geq 10 2つの問題の変数を除去した後、VIFがある各変数について。変数はさらに処理する必要がありますか、またはこのVIFは正常に見えますか?≤3.96≤3.96\leq 3.96 条件インデックス: 30以上の条件インデックス(CI)が問題であると聞きました。私の最高CIは16.66です。これは問題ですか? その他の問題: 他に考慮すべきことはありますか? 他に覚えておく必要があることはありますか?

6
個々の回帰が重要だが、VIFが低い場合の多重共線性
を予測するために使用している6つの変数()があります。データ分析を実行するとき、最初に多重線形回帰を試しました。このことから、2つの変数のみが重要でした。ただし、各変数を個々にと比較する線形回帰を実行した場合、1つを除くすべてが有意でした(が0.01未満から0.001未満のいずれか)。これは多重共線性によることが示唆されました。x1...x6x1...x6x_{1}...x_{6}yyyyyyppp これに関する私の最初の研究は、VIFを使用して多重共線性をチェックすることを示唆しています。Rから適切なパッケージをダウンロードすると、結果のVIFが3.35、3.59、2.64、2.24、および5.56になりました。オンラインのさまざまな情報源によると、VIFとの多重共線性について心配すべき点は4または5です。 これが私のデータにとって何を意味するのか困惑しています。多重共線性の問題はありますか?もしそうなら、どうすればいいですか?(これ以上データを収集できず、変数は明らかに関連していないモデルの一部です)この問題がない場合、データから何を取得する必要がありますか、特にこれらの変数が非常に重要であるという事実個々に、しかし結合されたときに全く重要ではありません。 編集:データセットに関していくつかの質問がありましたので、拡張したいと思います... この特定のケースでは、特定の社会的キュー(ジェスチャー、視線など)が他のキューを生成する可能性にどのように影響するかを理解しようとしています。モデルにすべての重要な属性を含めるようにしたいので、冗長と思われるものを削除するのは不快です。 現在、これに関する仮説はありません。むしろ、問題は研究されておらず、どの属性が重要であるかをよりよく理解することを目指しています。私の知る限り、これらの属性は互いに比較的独立している必要があります(視線とジェスチャが同じである、または別のサブセットであると言うことはできません)。他の研究者に何が見られているかを理解してもらいたいので、すべてのp値を報告できると便利です。 編集2:それはどこかに以下思い付いたので、私のnnn 24です。

3
共線性を検出するためのさまざまなアプローチのメリットは何ですか?
共線性が私のOLS回帰の問題であるかどうかを検出したいと思います。分散インフレ係数と条件インデックスは2つの一般的に使用される指標であることを理解していますが、各アプローチのメリットやスコアがどうあるべきかについて明確なものを見つけるのは難しいと感じています。 どのアプローチを行うか、および/またはどのスコアが適切かを示す著名な情報源は、非常に役立ちます。 同様の質問が「多重共線性の特定の測定を好む理由はありますか?」で尋ねられました。しかし、理想的には、引用できるリファレンスの後にいます。

1
一般化された加法モデルの分散インフレ係数
線形回帰の通常のVIF計算では、各独立変数/説明変数は、通常の最小二乗回帰では従属変数として扱われます。すなわちバツjXjX_j バツj= β0+ ∑i = 1 、i ≠ jんβ私バツ私Xj=β0+∑i=1,i≠jnβiXi X_j = \beta_0 + \sum_{i=1, i \neq j}^n \beta_i X_i 値のそれぞれについて格納される回帰とVIFは、によって決定されます nR2R2R^2んnn V私Fj= 11 − R2jVIFj=11−Rj2 VIF_j = \frac{1}{1-R^2_j} 特定の説明変数。 私の一般化加法モデルが Y= β0+ ∑i = 1んβ私バツ私+ ∑j = 1メートルsj(X私)。Y=β0+Σ私=1んβ私バツ私+Σj=1メートルsj(バツ私)。 Y=\beta_0+ \sum_{i=1}^n \beta_iX_i + \sum_{j=1}^m s_j(X_i) . このタイプのモデルに相当するVIF計算はありますか?多重共線性をテストするために滑らかな項を制御できる方法はありますか?sjsjs_j

1
分散インフレ係数の方程式
以下の質問以前尋ね、分散拡大要因(のVIFは)のように表すことができる Wは、単位長スケーリングされたバージョンであり、XVIFj= Var(b^j)σ2= [ w』jwj− w』jW− j( W』− jW− j)− 1W』− jwj]− 1VIFj=Var(b^j)σ2=[wj′wj−wj′W−j(W−j′W−j)−1W−j′wj]−1 \textrm{VIF}_j = \frac{\textrm{Var}(\hat{b}_j)}{\sigma^2} = [\mathbf{w}_j^{\prime} \mathbf{w}_j - \mathbf{w}_j^{\prime} \mathbf{W}_{-j} (\mathbf{W}_{-j}^{\prime} \mathbf{W}_{-j})^{-1} \mathbf{W}_{-j}^{\prime} \mathbf{w}_j]^{-1} WW\mathbf{W}バツX\mathbf{X} ここから方程式VIF j = 1に到達する方法を誰かに教えてもらえますか R 2 jは、他のリグレッサ変数でxjを回帰することから得られる複数の決定の係数です。VIFj= 11 − R2jVIFj=11−Rj2 \textrm{VIF}_j = \frac{1}{1-R_j^2} R2jRj2R_j^2バツjxjx_j これらの行列演算を正しく行うのに多くの問題があります...

2
ln(x)とln(x)^ 2の間の多重共線性
負の二項モデルを実行していて、予測変数の1つがカウント変数です。この変数は大きく歪んでいたため、ログ変換することにしました。 ただし、この変数の影響は非線形であると仮定されています。ただし、モデルに2乗項を含めるとすぐに、これらの2つの変数のVIFが20を超えているのに対し、他のすべての予測子は1と5の間のVIFで安定したままです。 私の現在の理解では、関係は線形であってはならず、したがって、マルチコリネリーは発生しません。 誰かが多重共線性の原因を説明し、この問題の可能な解決策を提供できますか?

2
なぜ単純に使用しないのですか
結局、VIFは次のように計算されます。 1/(1−R2j)1/(1−Rj2)1/(1-R_j^2)。のVIF555 に対応 R2JRJ2R_J^2 の 0.80.80.8。私にとって、によって提供された情報R2jRj2R_j^2VIFの数式を適用すると、さらに不明瞭になります。なぜ私はただ使用できないのですかR2jRj2R_j^2 多重共線性を検出するには?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.