変数のマッチングや統計的制御などの方法間のリンクは何ですか?


10

研究記事では、研究者が特定の変数を制御していることがよくあります。これは、マッチング、ブロッキングなどの方法で実行できます。

しかし、変数の制御は、影響を与える可能性のあるいくつかの変数を測定し、それらに対していくつかの統計分析を実行することによって統計的に行われるものであると常に思っていました。したがって、たとえば、独立変数と交絡変数を測定し、分析を行う調査やその他のテストを行うことができます。

  • 準実験で変数を制御することは可能ですか?
  • 変数のマッチングや統計的制御などの方法間のリンクは何ですか?

1
あなたはこの質問を見てみました:どのように-正確-ない-1-制御用-他-の変数
gung-モニカの復活

回答:


6

AdamOと同様に、この質問に答える鍵は、因果推論の概念と、観察設定を使用して因果モデルに「近づく」方法です。

完全な世界では、事実人口と呼ばれるものがあります。調査対象の人口は、関心のある単一のものを除いて、すべての点で同一です。この2つの人口の違いは、その違いに基づいており、真の因果関係です。

もちろん、これはありません。

ただし、それに近づこうとする方法はいくつかあります。

  • 無作為化:これは理論的に(無作為化が正しく行われている場合)、無作為化後の処理を除いて、同一の2つの母集団を与えるはずです。

  • 層別化:共変量のレベルの母集団を見ることができます。これは、少数のレベルでうまく機能しますが、すぐに面倒になります。

  • マッチング:マッチングは、グループAがグループBに類似するように調査母集団を集めようとする試みであり、したがって比較が可能です。

  • 統計的調整:共変量を回帰モデルに含めることにより、共変量のレベル内での効果の推定が可能になります。これも同様に、同類と比較するか、少なくとも試みます。

これらはすべて、その事実に反する人口に近づこうとする試みです。最善の方法は、何を取得したいか、そしてあなたの研究はどのようなものかによって異なります。


素晴らしい説明。元の質問に対して、はるかに簡潔かつ適切に対処します。これらの方法のことを付け加えましょう。空の階層があるという問題に対して、統計的な調整のみが影響を受けません。ケースコントロール研究では、年齢で人口を層別化したい場合、マッチング、層別化、および(ブロック)年齢別のランダム化では、50歳のケースを51歳のコントロールと比較するために、粗くするかビニングする必要があります。
AdamO

ただし、ロジスティック回帰では、連続情報を使用して、グループ間で暗黙的に情報を借用することができます。たとえば、線形または基底スプライン調整年齢を使用してその比較を行うことができます。これにより、回帰モデリングは最も強力で有用な統計手法の1つになります。
AdamO

@AdamO同意-上記の質問の私の回答では、情報の欠落が偶然とビニングによるものである限り、情報のない領域を平滑化するために使用できることを述べました。しかし、はい-回帰が素晴らしい理由があります。
フォミテ

2

この質問に答えるには、因果モデリングが鍵になると思います。最初に直面するのは、データを見さえする前に、関心のある調整/階層化/制御された正しい効果を特定することです。成人の身長と肺活量の関係を推定する場合、喫煙は成長を阻害し、肺活量に影響を与えるため、喫煙状況を調整します。交絡因子は、関心のある予測子に因果関係があり、関心のある結果に関連付けられている変数です。ジュデアパールの因果関係、第2版を参照してください。データ収集プロセスが合理的なロジックと以前の探索的研究からの事前の知識の使用を開始する前に、正しい交絡変数の分析を指定して強化する必要があります。

ただし、これは、一部の研究者が調整変数を選択するためにデータ駆動型の方法に依存していないことを意味しません。確認分析を行う場合、実際にこれを行うことに同意しません。複数の調整済みモデルのモデル選択におけるいくつかの一般的な手法は、前方/後方モデル選択であり、少なくとももっともらしいと思われるモデルのクラスに制限できます。このためのブラックボックスAIC選択基準は可能性に関連しているため、減少の度合いR2これらの調整変数の線形モデル。疫学に共通するもう1つのプロセスは、変数が主効果(オッズ比やハザード比など)の推定値を少なくとも10%変更した場合にのみモデルに追加されるというものです。これはAICベースのモデル選択よりも「より正確」ですが、このアプローチにはまだ大きな注意点があると思います。

私の推奨は、仮説の一部として目的の分析を事前に指定することです。年齢調整済みの喫煙/がんリスクは異なるパラメーターであり、対照研究では、粗雑な喫煙/がんリスクとは異なる推論につながります。主題の知識を使用することは、回帰分析で調整するための予測子を選択する、または実験および準実験計画のさまざまな他のタイプの「制御された」分析での層化、マッチング、または重み付け変数として選択する最良の方法です。


2

マッチングと回帰の関係についてのストーリーは、こちらのブログ投稿に簡単にまとめられています。要するに

「Dの回帰[治療指標] X [共変量]のダミー(つまり、飽和)モデルの完全なセット。Dの効果の結果として得られる推定値は、Xのマッチング、および分散による共変量セル全体の重み付けに等しいXを条件とした治療の例

完全に無害な計量経済学のセクション3.3 または反作用と因果推論のセクション5.3 も参照してください。これには、回帰が暗黙的に提供するXの重みが与えられた場合のDの加重が含まれます。

@EpiGradは、最初の質問から良いスタートを切ります。上にリンクされた本は、ほとんど独占的にそれを扱います。コンピュータサイエンスや数学の知識がない場合、Pearlは難しいと思うかもしれません(結局、それだけの価値はありますが!)。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.