複数回答の調査質問にどのように対処しますか?


10

私は人々に特定の場所(A、B、C、Dなど)に行ったことがあるかどうかを尋ねるデータセットを持っています。彼らは複数の選択を行うことができます。次に、鼻から検体を採取して、どこかに感染しているかどうかを確認します疾患。

特定の場所に行く人が感染する相対的なリスクを調べる必要があります。現時点ではロジスティック回帰しか考えられませんが、他に何か提案はありますか?

ありがとう。

回答:


2

結果は二分され、感染しているかどうかにかかわらず、ロジスティック回帰を使用できます。私は単にダミー変数アプローチをとり、参照カテゴリとして旅行を使用しません(つまり、各場所について、その場所を訪れた場合は1としてコード化され、その場所を訪れなかった場合は0としてコード化された変数があります)。そのため、ベータ係数をオッズに変換する(つまり、ログオッズを指数化する)と、場所Aのダミー変数の解釈は、場所Aを訪問しない他の場所を訪問する場所Aを訪問しない場所に対する訪問場所Aのオッズ比になります。このアプローチでは、多重共線性が問題になることにも注意してください(たとえば、Aに旅行する人々の多くがBにも旅行する場合、各係数にバイアスをかける可能性があります)。


5
このモデルは、応答が各場所への移動の付加的な関数であることを想定しています。相互作用用語を含めることで、引き続き機能させることができます。すべての可能な相互作用の完全なセットが必要な場合があります(双方向の相互作用だけでなく)。(これは、宛先の可能な組み合わせごとに個別のダミーを提供することと数学的に同じです。)
whuber

4
主な効果(4つのパラメーター)だけでなく、すべての相互作用(15のパラメーター)を使用する場合は、より多くのデータが必要です...
ステファンコラサ

@whuberと@Stephenの回答に感謝します。私はあなたたちそれぞれに完全に同意します。個人的には、複数の応答がそれほど一般的ではなかった場合の主な効果のダミー変数アプローチで大丈夫です。元のポスターの懸念を考えると、これは説得力のある仮定ではない可能性があります。元のポスターがA対Bに移動するリスクに関心がある場合は、他のデザインを提案する可能性があります(ある種のマッチング手順など)。また、選択バイアスが発生している場合を除いて、付加的なリスクは意味をなさないことに同意します。
Andy W
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.