観察的(すなわち、ランダム化されていない)研究で非独立の共変量を制御することはどの程度問題がありますか?


11

MillerとChapman(2001)は、観察(非ランダム化)研究の独立変数と従属変数の両方に関連する非独立共変量を制御することは絶対に不適切であると主張しています-これは社会科学では日常的に行われています。そうすることはどのくらい問題がありますか?この問題に対処する最善の方法は何ですか?自分の研究の観察研究で非独立共変量を日常的に管理している場合、それをどのように正当化しますか?最後に、これは同僚と方法論を論じるときに選ぶ価値のある戦いですか(つまり、それは本当に重要ですか)?

ありがとう

Miller、GA、&Chapman、JP(2001)。共分散の誤解された分析。Journal of Abnormal Psychology、110、40-48。- http://mres.gmu.edu/pmwiki/uploads/Main/ancova.pdf


「多重共線性の直感的な説明」に関する次の質問は、上記のコンテキストではある程度役立つかもしれません。

回答:


4

相関の程度と同じくらい問題があります。

皮肉なことに、変数の1つとの間に予想される相関関係がなかったとしても、制御を行う必要はありません。そして、もしあなたがあなたの独立変数があなたの従属に影響することを期待するならば、それは必然的に両方といくらか相関しています。ただし、相関性が高い場合は、実際の独立変数または従属変数を制御することと同じであるため、制御する必要はありません。


私はこれが古い答えであることを知っていますが、あなたはいくつかの参照をより詳細に行っていますか?あなたの最初のライン、特にミラーとチャップマンを明示的に参照してこれを議論するライン?
ジョナ

4

社会科学では、この問題を「治療後のバイアス」と呼ぶことがよくあります。治療後に発生する変数(因果的意味での変数を含む)を含む治療の効果(独立変数)を検討している場合、治療効果の推定にバイアスをかけることができます。これらの変数を含めると、ある意味で、治療の影響を制御することになります。治療Tが結果Yを引き起こし、他の変数AとAがYを引き起こす場合、Aの制御は、TがAを介してYに与える影響を無視します。このバイアスは、正または負になります。

社会科学では、AがAをフィードバックするTを引き起こし、AとTの両方がYを引き起こす可能性があるため、これは特に困難です。たとえば、GDPが高いと、民主化のレベルが高くなり(私たちの扱い)より高いGDP、より高いGDPとより高い民主化はどちらも政府の腐敗を少なくする、と言う。GDPは民主化を引き起こすので、それを制御できないと、内生性の問題または「変数のバイアスの省略」が発生します。しかし、GDPを管理する場合、治療後のバイアスがあります。可能な場合はランダム化試験を使用する以外に、ScyllaとCharybdisの間で船を操縦するためにできることは他にほとんどありません。ゲイリーキングはこれらの問題について、ハーバード大学の「社会科学における最も未解決の問題」イニシアチブへの指名としてここで語っています


3

私が見るように、多くの独立変数を「制御」する観察研究には2つの基本的な問題があります。1)説明変数が欠落しているという問題があり、モデルの仕様の誤りがあります。2)複数の相関する独立変数の問題((よく設計された)実験には存在しない問題)と、共変量の回帰係数とANCOVA検定が部分変数に基づいているため、解釈が困難であるという事実があります。1つ目は、観察研究の本質に固有のものであり、科学的コンテキストと競争力のある精緻化のプロセスで扱われます。後者は教育の問題であり、回帰モデルとANCOVAモデルを明確に理解し、それらの係数が正確に何を表しているかに依存しています。

最初の問題に関しては、いくつかの従属変数への影響のすべてが既知であり、モデルに含まれている場合、統計的な制御方法が効果的であり、個々の変数の効果の予測と推定が適切であることを実証するのは簡単です。「ソフトサイエンス」の問題は、関連する影響のすべてがめったに含まれていない、または知られていないため、モデルの指定が不十分であり、解釈が難しいことです。しかし、これらの領域には多くの価値のある問題が存在します。回答者は単に確実性に欠けています。科学的プロセスの美点は、それが自己修正的であり、モデルが疑問視され、精巧にされ、洗練されていることです。代替案は、実験を計画できない場合、これらの問題を科学的に調査できないことを示唆することです。

2番目の問題は、ANCOVAおよび回帰モデルの性質における技術的な問題です。アナリストは、これらの係数とテストが何を表すかについて明確にする必要があります。独立変数間の相関は、回帰係数とANCOVAテストに影響を与えます。彼らは部分テストです。これらのモデルは、モデル内の他のすべての変数に関連付けられている特定の独立変数と従属変数の分散を取り出し、それらの残差の関係を調べます。その結果、個々の係数とテストは、含まれる変数のセット全体とそれらの相互関係の明確な概念的理解の文脈の外で解釈することが非常に困難です。ただし、これによって予測に問題が生じることはありません。特定のテストと係数の解釈には注意してください。

補足: 後者の問題は、他の予測変数がモデルに導入された場合に、このフォーラムで以前に議論された、たとえば負から正への回帰符号の反転に関する問題に関連しています。相関する予測子が存在し、予測子のセット全体の間の複数の複雑な関係を明確に理解していない場合、(本質的に)回帰係数が特定の符号を持つと期待する理由はありません。強い理論があり、それらの相互関係が明確に理解されている場合、このような「逆転」の兆候は啓発的であり、理論的に有用です。しかし、多くの社会科学問題の複雑さを考えると、十分な理解は一般的ではないでしょうが、私は期待します。

免責事項: 私は社会学者であり、訓練を受けた公共政策アナリストです。


2

私は彼らの論文の最初のページを読んだので、彼らのポイントを誤解しているかもしれませんが、彼らは基本的にマルチコリニア独立変数を分析に含める問題を議論しているようです。彼らが年齢と学年について取った例は、彼らが次のように述べているので、この考えを示しています。

年齢は学校の学年に非常に密接に関連しているため、年齢に関連するバスケットボール能力の差異を取り除くと、学年に関連するバスケットボール能力のかなりの(おそらくほとんどすべての)差異が排除されます。

ANCOVAはレベルがダミー変数として表される線形回帰であり、共変量も回帰方程式で独立変数として表示されます。したがって、私が彼らのポイントを誤解していない限り(私は彼らの論文を完全に読んでいないのでかなり可能です)、マルチ共線変数を避けることを表明することと同等の「従属共変量を含めない」と言っているようです


彼らの主張は、相関する変数自体ではなく、実質的に互いに分離できない変数に関係しています。「これがなければ意味がない」とほとんど言うかもしれない変数。統計的に評価できる相関の度合いではなく、問題は概念的に解決する必要があります。年齢を上げずに成績を上げることはできますか?ほとんどありません。うつ病は不安を増すことなく激化しますか?それは難しい問題です。
rolando2

1

(最大の)問題は、グループ変数と共変量が一緒に方程式の予測子側にあるため、グループ変数はグループ変数ではなくなり、共変量が部分的に除外された変数なので、学習していたと思っていたグループ変数として認識または解釈できなくなります。大きな問題。

要点は45ページです。「ANCOVAは、「グループ」から意味のある差異を削除し、特性化されていない、調査グループの残差グループ変数を、グループが表した構造との不確実な関係で残します。」

現在の解決策は、DVから共変量を部分的に抽出し、ANCOVAを使用する代わりに、DV残差を通常のANOVAに送信することです。


2
しかし、それはancovaと同じですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.