まず第一に、重回帰は、実際にはデータについて「因果関係」の推論を実際には与えないことに気付きます。私の現在のケースを説明しましょう:
4つの独立変数があり、測定しているものの駆動に関与していることを望みます(ただし、確実ではありません)。重回帰を使用して、これらの各変数が従属変数にどの程度寄与しているかを確認したかったのです。おそらく、変数「4番」は私のアウトカム測定に非常に強く影響しています(ベータの重みが0.7に近い)。
ただし、「独立した」変数の一部は実際には相互に相関している可能性があるため、これでは不十分だと言われています。その場合、実際には3と4の両方が等しく貢献している可能性があるときに、「変数4」が従属変数を駆動していると考えることができます。これは正しいようですが、私はこれに慣れていないので、よくわかりません。
将来的にこの問題を体系的に回避するにはどうすればよいですか?多重回帰を使用して、「独立した」データに非表示の相関がまだ含まれていないことを確認する場合、どの特定の手順をお勧めしますか?
編集:データ自体は、特定の神経学的状態の一連のネットワーク(グラフ)モデルです。各ネットワーク全体のトポロジー(ここでは従属変数)を表す「クラスタリング係数」を測定し、より大きな100以上のネットワーク内の4つのノードの個々の接続性がグローバルクラスタリング値(4つの独立した変数)を駆動しているかどうかを確認しています。変数)。ただし、これらのノードはネットワークの一部であるため、ある程度定義すると、ある程度相関している可能性があります。