ロジスティック回帰における交互作用項の有意性と信頼区間


8

私はWinBugsにベイジアンロジスティック回帰を適合させました。これには相互作用項があります。このようなもの:

Prob(yi=1)=logit1(a+b1xi+b2wi+b3xiwi)

ここで、は標準化された連続変数、はダミー変数です。実際にはモデルはもっと複雑ですが、私は物事を単純に保ちたいです。xw

相互作用の項は「有意」ですが、単一の予測子ではありません。例えば、

mean(b1)=.2および分位数:および95(1.3.7)

mean(b2)=.4および分位数: -および95(1.3.5)

mean(b3)=1.4および分位数:(.および95(.42.5)

この発見にどう反応するかについてアドバイスはありますか?場合、影響全体に対して95%の信頼区間を計算できると思いました。これは次のようになります。xの合計効果の95%値、条件付き: -およびxw=1w=1(1.3+.4.7+2.5)=(.9+3.2)

これは正しいです?そうでない場合、どうすればよいですか?この件に関する参考資料はありますか?

回答:


5

いいえ、次の理由により、計算は正しくありません。

a)とは、おそらく事後分布で相関しています。b1b3

b)そうでなかったとしても、それはあなたがそれを計算する方法ではありません(多数の法則を考えてみてください)。

しかし、恐れることはありません。WinBUGSでこれを行う簡単な方法があります。新しい変数を定義するだけです:

b1b3 <- b1 + b3

そしてその値を監視します。

編集:

私の最初の点をよりよく説明するために、事後分布に共同多変量正規分布があると仮定します(この場合はありませんが、これは有用な例として役立ちます)。次に、パラメーター分布は。したがって、95%の信頼できる間隔は -これは平均と分散。biN(μi,σi2)(μi1.96σi,μi+1.96σi)

これで分布はます。分散項(したがって95%信頼できる区間)には、または区間からは見つけられない相関項含まれていることに注意してください。b1+b3N(μ1+μ3,σ12+2ρ13σ1σ3+σ32)ρ13b1b3

(多数の法則に関する私のポイントは、2つの独立した確率変数の合計の標準偏差が標準偏差の合計よりも小さいということでした。)

WinBUGSでそれを実装する方法に関しては、このようなものが私が考えていたものです:

model {
  a ~ dXXXX
  b1 ~ dXXXX
  b2 ~ dXXXX
  b3 ~ dXXXX
  b1b3 <- b1 + b3

  for (i in 1:N) {
    logit(p[i]) <- a + b1*x[i] + b2*w[i] + b3*x[i]*w[i]
    y[i] ~ dbern(p[i])
  }
}

サンプラーの各ステップで、ノードb1b3b1およびから更新されb3ます。これは、他の2つのノードの決定論的な関数であるため、事前分布は必要ありません。


私はあなたの通達を理解しているのかわかりません。b1とb3が相関している場合、なぜそれが問題になるのですか?つまり、それらの共同分布は、いくつかの相関パラメータで特性化されている必要がありますが、何ですか?限界分布があります。2.多数の法則について言及していることを理解できませんでした。拡大していただけますか?最後に、メインループにb1 + b3を追加する必要があると思いますか。そして、私はこの新しいパラメーターの前に漠然と使用する必要があるだけですか?ありがとうございました!
Manoel Galdino、2011年

1

いくつかの考え:1)これがベイジアンであるという事実が問題であるかどうかはわかりません。2)あなたのアプローチは正しいと思います3)ロジスティック回帰における相互作用はトリッキーです。SAS PROC LOGISTICに関する論文でこれについて書いたが、一般的な考え方は保持されている。その論文は私のブログにあり、ここから入手できます


ベイジアンかどうかは問題ではない可能性が高いことに同意します。私はちょうどそれが重要な場合に備えてベイジアンだと言った。
Manoel Galdino、2011年

1

現在、同様の問題が発生しています。また、wの総効果を計算するアプローチは正しいと私は信じています。これは次の方法でテストできると思います

h0:b2 + b3 * mean(x)= 0; ha:b2 + b3 * mean(x)!= 0

しかし、私はA / Nortonの論文に出くわしました。標準ソフトウェア。」(2003、p。123)

したがって、おそらくあなたはそれらの公式を適用しようとするべきです。(そして、それを行う方法を理解しているなら、教えてください。)

PS。これは、ロジスティック回帰のまぜテストに似ているようです。Alfred DeMaris(2004、p。283)は、このテストについて説明しています。

参照:

Ai、Chunrong / Norton、Edward(2003):ロジットおよびプロビットモデルの相互作用項、Economic Letters 80、p。123〜129

DeMaris、Alfred(2004):社会データによる回帰:継続的で限定的な応答変数のモデリング。John Wiley&Sons、Inc.、Hoboken NJ


参照いただきありがとうございます。私はそれを見て、問題が進展した場合はここで報告します。あなたの提案されたテストに関して、私はそれがうまくいくとは思いません。最初に、相互作用はxとw、wとxの双方向であることに注意してください。つまり、h0がtrueであっても、h2と言うことは可能です。b1+ b2 * mean(w)はゼロではありません。さらに、一般的に私は前もってヌルヒポテシスが偽であることを知っています。つまり、一般的にはゼロ効果のようなものはありません。十分な量の大きなサンプルがあれば、重要な影響を見つけることができます。
Manoel Galdino 2011年

そして別のポイント。h0とh2がtrueである場合でも、h3と言うことは可能です。b2+ b3 *(mean(x)+ sd(x))!=0。つまり、xの平均のみをテストする必要はありません(またはw)、ただし、値の分布全体について。相互作用項は、予測効果が予測子のサブグループによって異なると言うための方法であるためです。
Manoel Galdino 2011年

どういう意味かよくわかりません。b2 + b3 *平均(x)== 0かどうかをテストするときは、常にいくつかのテスト統計と比較して、結果がゼロと大幅に異なるかどうかを判断します。xの標準偏差だけが関連する要因ではありません。
mzuba

あなたが言ったことについて...私もあなたを完全に理解しているかどうかはわかりません。いずれにせよ、私のポイントの1つは、b2 + b3 *が(x)== 0を意味するという帰無仮説を棄却できなかったとしても、条件付きのWの平均効果を言えるとは言えないということだけです。 xの平均値はゼロではありません。ただし、相互作用項の全体的なポイントは、平均xだけでなくxの分布全体に対するWの影響を条件付けたいからです。
Manoel Galdino

よし。あなたの言っていることがわかります。(英語も私の第一言語ではありません。)私はあなたが書いたことが真実であると信じています。また、Ai /ノートンがprob(x)の分布全体に対して相互作用効果をプロットする理由でもあります。xの値によっては、相互作用効果はポジティブですが、そうでない人もいます。しかし、ダミーであるWの効果を計算することは、それがチョウテスト、構造破壊、部分母集団などとして解釈できるので、物事を簡単にするかもしれないと思います(計算しますか? w 0→1のステップ効果、または相互作用効果に興味がありますか?)
mzuba
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.