バイナリ結果の相対リスクを推定するポアソン回帰


42

簡単な要約

ポアソン回帰(相対リスク)に対して、ロジスティック回帰(オッズ比)がバイナリ結果のコホート研究で使用されるのはなぜ一般的ですか?

バックグラウンド

私の経験では、学部生および大学院生の統計学および疫学コースは、一般に、リスク推定値をオッズ比として報告するバイナリ結果のデータのモデリングにロジスティック回帰を使用する必要があることを教えています。

ただし、ポアソン回帰(および関連:準ポアソン、負の二項分布など)を使用して、バイナリ結果のデータをモデル化することもでき、適切な方法(堅牢なサンドイッチ分散推定量など)を使用して、有効なリスク推定値と信頼レベルを提供します。例えば、

ポアソン回帰から、相対リスクを報告することができます。これは、特に頻繁な結果、特に統計に強いバックグラウンドを持たない個人にとって、オッズ比と比較して解釈しやすいと主張する人もいます。Zhang J.とYu KF、相対的なリスクは?一般的な結果のコホート研究におけるオッズ比を修正する方法、JAMA。1998年11月18日; 280(19):1690-1。

医学文献を読むと、二値アウトカムのコホート研究の中で、ポアソン回帰の相対リスクよりもロジスティック回帰のオッズ比を報告するのがはるかに一般的であると思われます。

ご質問

バイナリ結果のコホート研究の場合:

  1. ポアソン回帰の相対リスクではなく、ロジスティック回帰のオッズ比を報告する正当な理由はありますか?
  2. そうでない場合、医学文献の相対リスクを伴うポアソン回帰の頻度は、主に科学者、臨床医、統計学者、および疫学者の間の方法論と実践の間の遅れに起因する可能性がありますか?
  3. 中間統計と疫学のコースには、バイナリ結果のポアソン回帰の詳細な議論を含めるべきですか?
  4. 学生や同僚に、適切な場合にロジスティック回帰よりもポアソン回帰を考慮するように勧めるべきですか?

相対リスクが必要な場合、なぜ(ロジスティックではなく)対数リンクで二項回帰を使用しないのですか?観測ごとに発生する可能性のあるイベントの数を条件にした場合、ポアソンファミリの平均分散関係はあまり意味がありません。
アンドリューM

@AndrewMログリンクを使用して二項回帰をどのように適用しますか?説明変数の正の値は1よりも確率値が大きく暗示する
Rufo

[01]

@AndrewMはい、線形予測子について説明します、ありがとうございます:)。しかし、モデルを実装できたとしても、それが適切かどうかはわかりません。最初の回答のコメントで示すように、0を1に、またはその逆を応答変数に交換すると、ログリンクは0.5を中心に対称ではないため、相対リスクの推定値は異なります(exp(beta_M1) =/= 1/exp(beta_M2))。それは私をかなり混乱させます。
Rufo

1
PY|バツ/PY|バツcPY|バツ/PY|バツcPYc|バツ/PYc|バツc

回答:


28

4つの質問すべてへの回答で、メモが前にあります。

実際に、コホート研究のロジスティック回帰からオッズ比を報告することは、現代の疫学研究にとってそれほど一般的ではありません。これは、症例対照研究のための選択の回帰技術のままですが、より洗練された技術は、今のような主要な疫学誌での分析のためのデファクトスタンダードです疫学AJEまたはIJE。観察研究の結果を報告する臨床雑誌に彼らが現れる傾向が大きくなります。また、ポアソン回帰は2つのコンテキストで使用できるため、いくつかの問題が発生します。2項回帰モデルの代わりに使用するものと、コホートで非常に一般的なイベント発生時のコンテキストです研究。特定の質問の回答の詳細:

  1. コホート研究の場合、実際にはありません。たとえば、区分的ロジスティックモデルが使用された可能性がある非常に特殊なケースがいくつかありますが、これらは外れ値です。コホート研究の全体的なポイントは、相対リスクまたは多くの関連する測定値を直接測定でき、オッズ比に依存する必要がないことです。ただし、2つのメモを作成します。ポアソン回帰では、レートを頻繁に推定しています、リスクではないため、それからの影響推定値は、レート比(主に、私の考えでは、RRと略すことができます)または発生密度比(IRRまたはIDR)としてしばしば記録されます。したがって、検索で実際に正しい用語を探していることを確認してください。生存分析法を使用した多くのコホート研究があります。これらの研究では、ポアソン回帰は、特にハザードが一定であるという問題のある仮定をいくつか行います。そのため、ポアソンモデルではなくコックス比例ハザードモデルを使用してコホート研究を分析し、その後のハザード比(HR)を報告することがはるかに一般的です。コホートを分析するための「デフォルト」メソッドを指定するために押された場合、疫学は実際にはコックスモデルによって支配されていると思います。これには独自の問題があり、非常に優れた疫学者はそれを変えたいと思っています。

  2. 頻度の低さの原因は2つあります。頻度が低いとは、必ずしもあなたが提案する程度に存在するとは限りません。1つは、はい-フィールドとしての「疫学」は厳密には閉じられておらず、臨床医、社会科学者など、さまざまな統計的背景の疫学者から膨大な数の論文を入手できます。ロジスティックモデルは一般的に教えられており、私の経験では、多くの研究者がより優れたツールよりも使い慣れたツールに頼るでしょう。

    2番目は、実際には「コホート」研究が何を意味するのかという質問です。Coxモデルやポアソンモデルのようなものには、実際の人時間の推定値が必要です。特にポアソンやコックスモデルのような生存方法があまり有用ではない初期の「エピの紹介」の例では、特定の期間のやや閉じた集団を追跡するコホート研究を取得することが可能です。ロジスティックモデル疾患罹患率が十分に低い場合に相対リスクに近似するオッズ比を推定するために使用します。二項回帰のように、それを直接推定する他の回帰技術には、新入生を簡単に脱線させる可能性がある収束の問題があります。引用したZouの論文は、どちらもポアソン回帰手法を使用して二項回帰の収束問題を回避していることに留意してください。しかし、二項式に適したコホート研究は、実際には「コホート研究のパイ」のほんの一部です。

  3. はい。率直に言って、サバイバル分析の方法は、通常よりも早い時期に登場するはずです。私のペット理論は、これがそうでない理由はロジスティック回帰のようなメソッドがコード化するのがより簡単であるということです。コーディングは簡単ですが、効果の推定値の有効性についてははるかに大きな注意事項があるテクニックは、「基本的な」標準として教えられていますが、これは問題です。

  4. 学生や同僚に適切なツールを使用するよう奨励する必要があります。一般的に、この分野では、ほとんどのレビュアーが一定のハザードの仮定に関する懸念を迅速に提起する(またそうする)ため、ポアソン回帰よりもCoxモデルの考慮を提案した方が良いと思います。しかし、はい、「質問をロジスティック回帰モデルにどのようにすすめますか」からすぐにそれらを取り除くことができます。私たちは皆より良くなるでしょう。しかし、時間がない研究を検討している場合、学生は二項回帰と、収束問題の場合に使用できるポアソン回帰などの代替アプローチの両方を導入する必要があります。


あなたがそれを直接推定する他の回帰技術[相対リスク、私は推定する]を言うとき、二項回帰のように収束の問題がある[...]、二項回帰をどのように適用して相対リスクを与えるでしょうか?@AndrewMログのリンクを示唆しているが、私はあなたが1より高い成功確率の推定を持つの問題を回避する方法を確認するために失敗する
Rufo

@Rufoログリンク付きの二項モデルをコホートで実行すると、相対リスクが推定されます。これらのモデルが時々1より大きい確率を推定することは、二項モデルが理想よりも実装が難しい理由の1つです。しかし、私はそれらを使用することに成功しました-あなたのデータがしばしば1を大きく下回る確率を持っていることは助けになります。
フォマイト

p

9

私も、相対リスクモデルがより適切であるとき、文学におけるロジスティックモデルの普及を推測します。統計学者としての私たちは、慣習の順守や「ドロップダウンメニュー」分析に固執することにあまりにも精通しています。これらは解決するよりもはるかに多くの問題を引き起こします。ロジスティック回帰は、バイナリの結果を分析するための「標準の既製ツール」として教えられます。ここでは、個人が死亡や障害のようなyes / noタイプの結果を持っています。

ポアソン回帰は、カウントを分析する方法として頻繁に教えられます。このような確率モデルは、0/1の結果のモデル化、特にまれな場合に非常にうまく機能することをやや強調しすぎています。ただし、ロジスティックモデルは、まれな結果でもうまく適用されます。オッズ比は、ケースコントロール研究のように結果に依存するサンプリングでも、ほぼリスク比です。相対リスクまたはポアソンモデルについても同じことが言えません。

ポアソンモデルは、個人が複数回「転帰」する可能性があり、ヘルペスの発生、入院、乳がんなどの累積発生率に関心がある場合にも有用です。このため、指数係数は相対レートとして解釈できます。発生率とリスクの違いを調べるには:1,000人年あたり100件のケースがあり、100人全員が1人の個人で発生した場合、発生率(割合)は10人年あたり1件です。ヘルスケア提供の設定では、まだ100件の症例を治療する必要があり、80%の人に予防接種を行うと、発生率が80%低下します(アプリオリ)。ただし、少なくとも1つの結果のリスクは1/1000です。結果と質問の性質により、どのモデルが適切であるかが決まります。

vary=Ey1Ey

ログE[Y|バツ]=β0+β1バツvarY=E[Y]1E[Y]

ところで、Zhangの記事は、インターセプト項の変動を考慮していない相対リスク推定値に基づいて、偏りのある推定値を提供しています。ブートストラップにより推定器を修正できます。

特定の質問に答えるには:

  1. 結果がまれな場合、それらはほぼ同じです。結果が共通である場合、ポアソンからの相対レート推定量の分散が過剰に膨らんでいる可能性があり、バイナリ結果といくつかのエクスポージャー間の関連性の偏りはあるが効率的な推定としてオッズ比を好む場合があります。また、症例対照研究は、結果に依存するサンプリングで変化しない尺度としてオッズ比の使用を正当化すると考えています。スコットとワイルド97は、これに関する方法を議論します。もちろん、他の雑誌には専用の統計レビューアがいない場合があります。

2.3。私はあなたが非難し、医学的レビューと学問で何が起こるかについて過度に仮定していると思います。

  1. 可能な場合は常に、適切なモデルを使用するよう生徒に奨励する必要があります。

http://biostats.bepress.com/cgi/viewcontent.cgi?article=1128&context=uwbiostat


2
「科学的な関心が相対速度の推定にある場合、ロジスティック分散構造とポアソン平均構造を使用したGLMである相対リスク回帰」というハイブリッドモデルが存在するというのが私の理解です。
アンドリューM

2
@AndrewM確かに。実際、私はそれが優先言語だと思います。それを指摘してくれてありがとう。この質問を編集して、ポアソンモデルは誤った想定平均分散関係であるという点で「作業モデル」であることを強調するトーマスラムリーのワーキングペーパーへの参照を含めるようにしました。
AdamO

「結果がまれな場合、それらはほぼ同じです」とはどういう意味ですか?有病率の推定にRRの代わりにORを使用するための「まれな」結果の最大パーセンテージは何ですか?
vasili111

1
@ vasili111これは、明確な答えのない熱い議論のトピックです。最近では、発生率が1/30を超えるなど、それほどまれではない場合に、「まれな」仮定を立てる人々の批判が多く見られます。そして、多変量モデルでは、何でもできます!
AdamO
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.