重回帰は共変量を実際に「制御」できますか？

私たちはすべて、考えられるすべての潜在的な交絡因子を重回帰モデルに含めることで、非ランダム化予測子Xと結果の間の因果リンクを確立しようとする観察研究に精通しています。このように、すべての交絡因子を「制御する」ことにより、関心のある予測子の効果を分離します。

主に私の統計学のクラスのさまざまな教授によって行われたオフハンドの発言に基づいて、私はこの考えにますます不快感を抱いています。それらはいくつかの主要なカテゴリーに分類されます。

1.考え、測定する共変量のみを制御できます。
これは明らかですが、実際に最も有害で乗り越えられないものなのでしょうか。

2.このアプローチは、過去にugい間違いを引き起こしました。

たとえば、Petitti＆Freedman（2005）は、何十年にもわたって統計的に調整された観察研究が、心臓病のリスクに対するホルモン補充療法の効果に関する悲惨な誤った結論に至った経緯について議論しています。後のRCTでは、ほぼ逆の効果が見つかりました。

3.予測変数と結果の関係は、共変量を制御すると奇妙に動作する可能性があります。

Yu-Kang Tu、Gunnell、＆Gilthorpe（2008）は、主のパラドックス、シンプソンのパラドックス、サプレッサー変数など、いくつかの異なる症状を議論しています。

4.単一モデル（重回帰）で共変量を適切に調整し、同時に予測結果の関係をモデル化することは困難です。

傾向スコアや交絡因子の層別化などの方法の優位性の理由としてこれを聞いたことがありますが、本当にそれを理解しているかはわかりません。

5. ANCOVAモデルでは、対象の共変量と予測子が独立している必要があります。

もちろん、対象の予測変数と相関しているため、交絡因子を正確に調整します。したがって、モデルは、必要なときに正確なインスタンスで失敗するようです。議論は、調整はランダム化試験でのノイズ低減にのみ適しているということです。Miller＆Chapman、2001年は素晴らしいレビューを与えます。

だから私の質問は：

これらの問題や私が知らないその他の問題はどれほど深刻ですか？
「すべてをコントロールする」研究を見たとき、私はどれほど恐れるべきでしょうか？

（この質問が議論の領域にあまり深く入り込んでいないことを望み、それを改善するための提案を喜んで誘います。）

編集：新しい参照を見つけた後、ポイント5を追加しました。

multiple-regression ancova observational-study

— ハーフパス
ソース

質問2については、「すべてのコントロール」が仕様のより一般的な問題だと思います。パラメトリックモデルが正しく指定されている状況を考えるのに苦労しています。そうは言っても、モデルは現実を単純化するものであり、それがこのタイプの研究の技術の位置です。研究者は、モデルで何が重要で、何が重要でないかを決定する必要があります。

— カーク

この質問であなたは私をファンにしました。

— rolando2

これはいくつかの非常に良い点をもたらすと思います。しかし、答えは厳密に統計的な分野の外にあると思います。したがって、統計結果は、1）複製された場合、2）実質的に実行可能である場合など、より価値があります。また、MAGIC基準およびAbelsonの一般的な議論も参照してください。

— ピーターフロン-モニカの復職

ポイント＃5は絶対に間違っています。Miller＆Chapmanの論文は完全に間違っています。

— ジェイクウェストフォール

@ half-pass論文の中心的主張、つまり焦点予測子Xと共変量Cは無相関でなければならないということ以外、それについて他に何を言おうかわからないだけです。ANCOVAは単なる回帰モデルであるため、これと同じ推論により、ほぼすべての実際の多重回帰の使用も無効になります。私は数ヶ月前にこのひどい論文についてTwitterでいくつか議論しました：twitter.com/CookieSci/status/902298218494644228

— Jake Westfall

回答:

おそらく広く受け入れられている、非統計的な答えがあります-共変量について実際に制御していると主張するために必要な仮定は何ですか？

これは、Judea Pearlの因果グラフを使用して実行でき、計算を実行できます。

http://ftp.cs.ucla.edu/pub/stat_ser/r402.pdf および彼のWebサイトの他の資料を参照してください。

統計学者として、我々はすべてのモデルが偽であることを知っています、そして、本当の統計問題は、私たちの答えがほぼOKであるように、あまり間違っていない可能性が高いと特定された仮定です。パールはこれを認識しており、彼の作品でそれを議論したが、おそらくない、明示的に、多くの場合、回避するのに十分なんflustrating答え持っている彼の主張に多くの統計を（私は彼がすると信じて何の仮定が作成する1つの必要がありませんか？）。

（現在、ASAはこれらの方法を統計コースに含めるための教材に賞を提供しています。こちらをご覧ください）

— パネロン
ソース

エレガントなグラフィック表現への素晴らしい参照、ありがとう。

— ハーフ渡す

質問1への回答：

深刻さの程度は、状況に応じて評価するのが最適です （つまり、妥当性に寄与するすべての要因を考慮する必要があります）。
深刻さの程度は、カテゴリー的に評価すべきではありません。例は、研究デザインの推論の階層の概念です（例：症例報告は最低で、RCTはカテゴリー的に最高です）。このタイプのスキームは、高品質のエビデンスをすばやく識別するための簡単なヒューリスティックとして、医学部で頻繁に教えられています。このタイプの思考の問題は、それがアルゴリズムであり、実際には過度に決定論的であり、答え自体が過剰に決定されていることです。これが発生すると、適切に設計されたRCTが適切に設計された観察研究よりも悪い結果をもたらす可能性がある方法を逃す可能性があります。
疫学者の視点からの上記のポイントの完全な議論については、この読みやすいレビューを参照してください（Rothman、2014）。

質問2への回答：

とても恐れてください。他の人がすでに言ったことを単純に繰り返し、統計モデリングにおける批判的思考に関する Richard McElreathのエレガントな紹介テキストから（大体）引用するために：

「...すべてのモデルは偽ですが、一部は有用です...」

— フランク
ソース