ポアソン回帰で係数を解釈する方法は?


64

ポアソン回帰の主な効果(ダミーコード化された因子の係数)をどのように解釈できますか?

次の例を想定します。

treatment     <- factor(rep(c(1, 2), c(43, 41)), 
                        levels = c(1, 2),
                        labels = c("placebo", "treated"))
improved      <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),
                        levels = c(1, 2, 3),
                        labels = c("none", "some", "marked"))    
numberofdrugs <- rpois(84, 10) + 1    
healthvalue   <- rpois(84, 5)   
y             <- data.frame(healthvalue, numberofdrugs, treatment, improved)
test          <- glm(healthvalue~numberofdrugs+treatment+improved, y, family=poisson)
summary(test)

出力は次のとおりです。

Coefficients:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)       1.88955    0.19243   9.819   <2e-16 ***
numberofdrugs    -0.02303    0.01624  -1.418    0.156    
treatmenttreated -0.01271    0.10861  -0.117    0.907   MAIN EFFECT  
improvedsome     -0.13541    0.14674  -0.923    0.356   MAIN EFFECT 
improvedmarke    -0.10839    0.12212  -0.888    0.375   MAIN EFFECT 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

私はのための発生率があることを知ってnumberofdrugsいますexp(-0.023)=0.977。しかし、ダミー変数の主な効果をどのように解釈しますか?



参照された質問がトピック外として閉じられたことは興味深いです。(ユーザーに係数の表を返した統計プログラムの出力にも回答が適用されるため、トピック外であることに同意しなかったでしょう。 SOコミュニティは、Rからの出力の解釈を要求する質問に対して「きつすぎる」と思われます。これらは、コーディングの助けが必要であるという提案がないため、StackOverflowの実際のトピックではありません。
DWin

@DWin、統計出力の解釈はCross Validatedのトピックから外れているとは思わない。私はこれの複製としてその質問を閉じることに投票しました。他の人はOTに投票したようです。彼らは、OPがそこにコンピューター出力をダンプし、[誰かに[それら]の統計分析を実行することを望んだ」ように見えたからです。
GUNG -モニカ元に戻し

1
@gung:OTと呼んでいるのはあなたではないことは明らかでした。あなたのコメントはその点に関して明確でした。(私はあなたに同意していると思いました。)近い投票に記載されている「理由」は、多くの場合、多数決または複数の決定です。
DWin

回答:


56

指数numberofdrugs係数は、1単位増加したhealthvalueときに推定値を計算するために使用する乗法項numberofdrugsです。カテゴリー(因子)変数の場合、指数係数はその変数のベース(第1因子)レベルに対する乗法的項です(Rは既定で処理のコントラストを使用するため)。これexp(Intercept)はベースラインレートであり、他のすべての推定値はそれに比例します。

あなたの例では、推定healthvalueを持つ人のための2薬、"placebo"およびimprovement=="none"(乗算の同等としてEXP内部の追加を使用して)次のようになります。

 exp( 1.88955 + 2*-0.02303 + 0 + 0 )
 [1] 6.318552

4薬物、、"treated"および"some"改善の誰かが推定healthvalueしている間

exp( 1.88955 + 4*-0.02303 + -0.01271 + -0.13541)
[1] 5.203388

補遺:これは、「ログスケールで加算的」であることを意味します。「対数オッズスケールでの加算」とは、先生であるバーバラマッナイトが、あらゆる種類の予測を行う際にロジスティック回帰に適用されるすべての項係数を使用する必要性を強調するときに使用したフレーズです。最初にすべての係数と共変量の値を加算してから、べき乗します。Rの回帰オブジェクトから係数を返す方法は、一般にcoef()抽出関数を使用することです(以下で異なるランダムな実現を行います)。

 coef(test)
  #   (Intercept)    numberofdrugs treatmenttreated     improvedsome   improvedmarked 
  #   1.18561313       0.03272109       0.05544510      -0.09295549       0.06248684 

だから、被検体の推定値の計算4の薬、"treated"で、"some"改善は次のようになります。

 exp( sum( coef(test)[ c(1,2,3,4) ]* c(1,4,1,1) ) ) 
 [1] 3.592999

そして、その場合の線形予測子は次の合計である必要があります。

 coef(test)[c(1,2,3,4)]*c(1,4,1,1) 
 #    (Intercept)    numberofdrugs treatmenttreated     improvedsome 
 #     1.18561313       0.13088438       0.05544510      -0.09295549

これらの原則は、係数の表をユーザーに返す統計パッケージに適用する必要があります。この方法と原則は、Rの使用から見えるよりも一般的です。


デフォルトの表示では「消える」ため、選択した明確化コメントをコピーしています。

Q:係数を比率として解釈します!ありがとうございました!– MarkDollar

A:係数は比率の自然対数です。– DWin

Q2:その場合、ポアソン回帰では、指数係数は「オッズ比」とも呼ばれますか?– oort

A2:いいえ。ロジスティック回帰である場合、LHSはイベントの数であり、暗黙の分母はリスクのある数であるポアソン回帰では、指数係数は「レート比」または「相対リスク」です。


それで、あなたは二度投票できますか?いいね 解釈のRコードの実装を提供することで、分類規則の力からそれを救うことができると考えました。OPは、いい自己完結型の例を構成しました。たぶん、抽出機能をデモンストレーションすべきだったので、そうするだろうと思います。
DWin

はい、SOに対するあなたの回答を支持し、それからここに移動し、再び支持しました:)
ブランドン

これまでありがとう!私はダミーとcavariablesの間の現実を知っていますが、私は主効果を解釈する方法に興味があります(それらをマークしました)。たとえば、ダミー処理された 'exp(-0.012)= 0.99'の場合、メインエフェクトから偶発的なレートを取得し、参照カテゴリから処理済みに切り替えるときに、ヘルス値が減少するレートとして解釈することは可能ですか?違いますか?
MarkDollar

指数係数は常に比として解釈されます。「何」に対する「何」の比率は、分析の単位に依存します。「レート」は異なり、暗黙の数値と時間値を持ちます。したがって、用語を変更する場合は、「はい」と答えます。最良の答えは、分析状況を完全に説明することです。
DWin

ああ、これは私が知りたかったことです。したがって、係数は比率として解釈します!ありがとうございました!
-MarkDollar
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.