カテゴリーの影響とロジスティック回帰におけるそれらの有病率を視覚化する最良の方法は何ですか?


11

世論調査データを使用して、候補者の投票の主要な予測因子に関する情報を提示する必要があります。気になるすべての変数を使用してロジスティック回帰を実行しましたが、この情報を提示するための良い方法が見つかりません。

私のクライアントは、効果のサイズだけを気にするのではなく、効果のサイズとそのような属性を持つ母集団のサイズとの間の相互作用について気にします。

グラフでそれをどのように処理できますか?助言がありますか?

次に例を示します。

従属変数が候補に投票/否定である場合の変数SEX(男性= 1)のは2.3です。これは、指数化され、オッズ比または確率として扱われた後の大きな数です。ただし、この調査が実施された社会では30%の男性しかいませんでした。したがって、男性はこの候補者をかなり支持しましたが、それらの数は、多数派選挙に勝とうとする候補者にとって重要ではありません。β


FWIW、「相互作用」という用語の使用は正しくありません(たとえば、ここまたはここを参照してください)。「……しかし、効果のサイズが大きく、そのような属性を持つ母集団のサイズも大きい状況を特定することについて」
ガン-モニカの回復

回答:


10

@PeterFlomの例には奇妙な点があることに同意しますが、それを脇に置いて、説明変数がカテゴリカルであることに気づきました。それが一貫して真である場合、これはこれを大幅に簡略化します。私はこれらの効果を示すためにモザイクプロットを使用します。モザイクプロットは条件付きの縦横比を垂直に表示しますが、各カテゴリの幅は、サンプル内の限界(つまり無条件​​)の縦横比を基準にしてスケーリングされます。

以下は、Rを使用して作成された、タイタニック号の災害のデータの例です。

data(Titanic)

sex.table   = margin.table(Titanic, margin=c(2,4))
class.table = margin.table(Titanic, margin=c(1,4))
round(prop.table(t(sex.table), margin=2), digits=3)
#          Sex
# Survived  Male Female
#      No  0.788  0.268
#      Yes 0.212  0.732
round(prop.table(t(class.table), margin=2), digits=3)
#           Class
# Survived   1st   2nd   3rd  Crew
#      No  0.375 0.586 0.748 0.760
#      Yes 0.625 0.414 0.252 0.240

windows(height=3, width=6)
  par(mai=c(.5,.4,.1,0), mfrow=c(1,2))
  mosaicplot(sex.table,   main="")
  mosaicplot(class.table, main="")

ここに画像の説明を入力してください

左側では、女性が生き残る可能性がはるかに高いことがわかりますが、男性はおそらく乗船している人々の約80%を占めていました。したがって、男性の生存者の割合を増やすことは、女性の生存者の割合を大幅に増やすことよりもはるかに多くの命を救うことになります。これはあなたの例にいくらか似ています。右側には、乗組員と操縦者が最大の割合を占めたが、生存の可能性が最も低い別の例があります。(それだけの価値があるので、これはこれらのデータの完全な分析ではありません。クラスとセックスもタイタニック号から独立していないためですが、この質問のアイデアを説明するには十分です。)


5

社会に男性が10%しかいなかった社会について少し知りたいのですが...

実行できることの1つは、オッズ比をプロットし、それぞれにサンプルのサイズでラベルを付けることです。

両方の変数をグラフで表す場合は、バブルチャートを作成し、y軸上の各バブルの位置をオッズ比のサイズとサンプルサイズに比例するバブルの面積に一致させます。


7
多分これ
Andre Silva
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.