共線性を検出するためのさまざまなアプローチのメリットは何ですか?


11

共線性が私のOLS回帰の問題であるかどうかを検出したいと思います。分散インフレ係数と条件インデックスは2つの一般的に使用される指標であることを理解していますが、各アプローチのメリットやスコアがどうあるべきかについて明確なものを見つけるのは難しいと感じています。

どのアプローチを行うか、および/またはどのスコアが適切かを示す著名な情報源は、非常に役立ちます。

同様の質問が「多重共線性の特定の測定を好む理由はありますか?」で尋ねられました。しかし、理想的には、引用できるリファレンスの後にいます。


4
共線性は非常に程度の問題であることを覚えておいてください。そのため、素晴らしい引用可能な数値を与えるテキストを見つけたとしても、「問題なし」と「問題がある」のハードカットオフ値として扱うべきではありません。 」
Silverfish

4
@Silverfishは良いアドバイスをします。Belsley、Kuh、およびWelschはまた、共線性が存在しても、必ずしも有害ではないことを強調しています。それが実際に分析の問題を引き起こしているかどうかを判断する必要があります。
whuber

回答:


11

Belsley、Kuh、Welschはこの種の質問に行くためテキストです。それらには、「歴史的展望」というタイトルのセクションに古い診断の広範な議論が含まれています。彼らが書くVIFに関して

XRXX

R1=(XX)1R1riiVIFi

VIFi=11Ri2
Ri2XiRi2R

RR1XXβ^i特異値に関連付けられたコンポーネントに。この分解の力は、その存在を示すだけでなく、(多くの場合)共線性の性質を明らかにする能力にあります。

Xi1,,Xik

最終的に、BKWは、共線性を次の方法で診断することを推奨しています。

...次の二重条件:

  1. 条件指数が高いと判断され、以下に関連する特異値
  2. 2つ以上の推定回帰係数分散の分散分解率が高い

30X0.5


10
  • R21/(1R2)

    ただし、通常インターセプトはこれらの「ヘルパー」回帰に静かに含まれているため、通常実装されているVIFはインターセプトとの共線性について通知できません。回帰が高いVIFを持っている場合はさらに、あなたはすぐに知っていないそのほかの説明変数は、共線性のために責任があります。ヘルパー回帰の標準化された係数を調べる必要があります。

  • Belsley、Kuh&Welsch(Belsley、DA; Kuh、E.&Welsch、RE Regression Diagnostics: Identificationing Influential Data and Sources of Collinearity。John Wiley&Sons、1980)の状態インデックスと共線性分解比率は、理解するのがはるかに困難です。私は数年前にこれらを使って作業していましたが、ここでは復習せずにそれらを説明しようとはしません;-)

    これらの診断で、切片との共線性を検出できます。また、共線性分解の比率を調査して、特定のリグレッサの共線性の原因となっている他のリグレッサを推定できます。


ありがとう-非常に便利です-経験則10以上のVIFの引用を偶然知っていますか...私は多くのエコ講義ノートで見つけることができますが、それを述べている出版物を見つけることができません。 。
キレニア

@kyrenia「10より大きい」は、私が見た唯一のしきい値からかけ離れています。分野ごとに、あるいは作家ごとにばらつきがあるのか​​。
Silverfish

3
2100

@whuberありがとうございます。これは非常に興味深い所見であり、OPが提起する質問に非常に関連しています。StackExchangeシステム内のコメントの「第2ランク」の重要性を考えると、それを優れた回答に組み込むことを検討する必要があると思います。
Silverfish、2015

6

引用に広く利用可能な参照のために、ファラウェイブックページ117の条件番号に基づいて問題を検出するための30以上の経験則を提供し、統計的学習への入門、101ページ、5または10以上のVIF値は、問題を示していると述べています。

おそらく、多重共線性を識別するためにどの方法を使用するかよりも重要なのは、それをどのように扱うかです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.