Rothman、Greenland、LashによるModern Epidemiology 3rd Editionから:
オーバーマッチングには少なくとも3つの形式があります。1つ目は、統計的効率を損なうマッチングに関連します。たとえば、疾患ではなく曝露に関連する変数のケースコントロールマッチングなどです。2つ目は、露出と疾患の中間でのマッチングなど、有効性を損なうマッチングを指します。3番目は、コスト効率を損なうマッチングを指します。
AndyWからの答えは、オーバーマッチングの2番目の形式についてです。簡単に言うと、それらがすべて機能する方法は次のとおりです。
1:交絡因子となるための基準の1つは、共変量が結果と露出の両方に関連付けられることです。それがそれらの1つにのみ関連付けられている場合、それは交絡因子ではなく、実行に成功したのは信頼区間を広げることだけです。
このタイプのオーバーマッチングをさらに詳しく調べるには、1つ以上の交絡因子の各ケースに対応する1つのコントロールを使用して、バイナリ露出の一致するケースコントロール研究を検討してください。分析の各階層は、いくつかの階層を組み合わせることができない場合を除いて、1つのケースと1つのコントロールで構成されます。ケースとそれに対応するコントロールが両方とも公開されているか、両方とも公開されていない場合、2 x 2テーブルの1つのマージンは0になります...このような1組の被験者は分析に情報を提供しません。露出の相関関係を層別化すると、そのようなテーブルが発生する可能性が高まるため、層別分析で失われる情報が増える傾向があります。
2:これはAndyWによって部分的に議論されています。中間因子でのマッチングは、露出と結果の両方によって影響を受ける何かでのマッチングと同様に、推定にバイアスをかけます。これは基本的にはコライダーを制御するものであり、それを行うテクニックはすべて、推定にバイアスをかけます。
ただし、潜在的なマッチング係数が曝露によって影響を受け、その因子が疾患に影響を与える(つまり、中間変数である)場合、または曝露と疾患の両方によって影響を受ける場合は、因子のマッチングにより、粗大な影響と調整された影響の両方がバイアスされます。見積り。これらの状況では、ケースコントロールマッチングは、選択バイアスの回復不可能な形式にすぎません。
3:これは、研究デザインの問題です。1と2の理由で一致させる必要のない変数を大幅に一致させると、簡単に取得したコントロール(友人、家族、近くのソーシャルネットワークなど)を拒否して、共変量の不要なセット。それにはお金がかかります- バイアスや精度の目に見えるほどの利益がなく、実際に両方を脅かしていたために、より多くの被験者、より良い曝露または病気の確認などに費やされたかもしれないお金。