最初に、比例オッズロジスティック回帰を使用して累積相対リスク(たとえば、より高い結果を報告する相対リスク)を概算する必要があるかどうかを尋ねる必要があると思います。比例オッズモデルの確率論的定式化は、潜在ロジスティック確率変数の任意のビンを観察することに依存しています。ここで私の関連質問を参照してください。この方法の優雅さは、ロジスティックRVの生存関数(1-CDF)が逆ロジットであることです。例:。P(Z> z)= exp(− z)/(1 + exp(− z))
相対リスクモデルの同様の確率的導出を仮定する場合、生存関数がある潜在確率変数を見つけることが望まれます。しかし、これはメモリのない指数確率変数にすぎません。したがって、しきい値付きの結果変数の行列を構築すると、セルの周波数は条件付きで独立しているため、ちょうどポアソン回帰である対数線形モデル。ポアソン係数の解釈は相対速度であるため、これは安心です。数値変数としての応答変数と回帰係数の間の相互作用をモデル化すると、正しい解釈につながります。P(Z> z)= exp(− z)O私はj= 私(Y私≥ J )
つまり、対数線形モデルを近似します。
ログ(N私はj| Y私、X私、)= η0私(Y私= 0 )+ … + ηj私(Y私= = j )+ β⃗ バツ私、+ γ⃗ diag(Y)X私、
MASSパッケージの例を使用すると、相対リスクがすべてのインスタンスのORよりもはるかに小さいという望ましい結果が得られます。
newData <- data.frame('oy'=oy, 'ny'=as.numeric(y), housing)
## trick: marginal frequencies are categorical but interactions are linear
## solution: use linear main effect and add indicators for remaining n-2 categories
## equivalent model specifications
fit <- glm(Freq ~ oy.2 + ny*(Infl + Type + Cont), data=newData, family=poisson)
effects <- grep('ny:', names(coef(fit)), value=T)
print(cbind(
coef(summary(fit))[effects, ],
coef(summary(house.plr))[gsub('ny:','', effects), ]
), digits=3)
私たちに与える:
Estimate Std. Error z value Pr(>|z|) Value Std. Error t value
ny:InflMedium 0.360 0.0664 5.41 6.23e-08 0.566 0.1047 5.41
ny:InflHigh 0.792 0.0811 9.77 1.50e-22 1.289 0.1272 10.14
ny:TypeApartment -0.299 0.0742 -4.03 5.55e-05 -0.572 0.1192 -4.80
ny:TypeAtrium -0.170 0.0977 -1.74 8.21e-02 -0.366 0.1552 -2.36
ny:TypeTerrace -0.673 0.0951 -7.07 1.51e-12 -1.091 0.1515 -7.20
ny:ContHigh 0.106 0.0578 1.84 6.62e-02 0.360 0.0955 3.77
最初の4列は対数線形モデルからの推論であり、次の3列は比例オッズモデルからのものです。
これはおそらく最も重要な質問に答えます:どのようにしてそのようなモデルに適合するかです。RRに対するまれなイベントのORの相対的な概算を調査するために使用できると思います。