異なるリンク関数を使用した順序ロジスティック回帰


8

4つの明確で順序付けられたカテゴリを持つ結果変数を考​​えてみます。これは、順序ロジスティック回帰を使用して、共変量がラダーを1つ「ステップ」上に移動するときの共変量の効果を推定するのに適しているようです。

しかし、主題はカテゴリー全体に特に均等に分散しているため、疑問が生じます。

  • ORが相対リスクを概算するための「まれな結果の仮定」は、通常のロジスティック回帰で依然として真実ですか?
  • もしそうなら、相対リスクを直接推定するようにリンク関数を変更することは可能ですか?また、そのような場合の収束の問題に対処するために、ロバストな標準誤差を持つポアソン近似のようなものを使用することはまだ可能ですか?

回答:


2

最初に、比例オッズロジスティック回帰を使用して累積相対リスク(たとえば、より高い結果を報告する相対リスク)を概算する必要があるかどうかを尋ねる必要があると思います。比例オッズモデルの確率論的定式化は、潜在ロジスティック確率変数の任意のビンを観察することに依存しています。ここで私の関連質問を参照してください。この方法の優雅さは、ロジスティックRVの生存関数(1-CDF)が逆ロジットであることです。例:。P(Z>z)=exp(z)/(1+exp(z))

相対リスクモデルの同様の確率的導出を仮定する場合、生存関数がある潜在確率変数を見つけることが望まれます。しかし、これはメモリのない指数確率変数にすぎません。したがって、しきい値付きの結果変数の行列を構築すると、セルの周波数は条件付きで独立しているため、ちょうどポアソン回帰である対数線形モデル。ポアソン係数の解釈は相対速度であるため、これは安心です。数値変数としての応答変数と回帰係数の間の相互作用をモデル化すると、正しい解釈につながります。P(Z>z)=exp(z)Oij=I(Yij)

つまり、対数線形モデルを近似します。

log(Nij|Yi,Xi,)=η0I(Yi=0)++ηjI(Yi==j)+βXi,+γdiag(Y)Xi,

MASSパッケージの例を使用すると、相対リスクがすべてのインスタンスのORよりもはるかに小さいという望ましい結果が得られます。

newData <- data.frame('oy'=oy, 'ny'=as.numeric(y), housing)

## trick: marginal frequencies are categorical but interactions are linear
## solution: use linear main effect and add indicators for remaining  n-2 categories
## equivalent model specifications
fit <- glm(Freq ~ oy.2 + ny*(Infl + Type + Cont), data=newData, family=poisson)
effects <- grep('ny:', names(coef(fit)), value=T)
print(cbind(
  coef(summary(fit))[effects, ],
  coef(summary(house.plr))[gsub('ny:','', effects), ]
), digits=3)

私たちに与える:

                 Estimate Std. Error z value Pr(>|z|)  Value Std. Error t value
ny:InflMedium       0.360     0.0664    5.41 6.23e-08  0.566     0.1047    5.41
ny:InflHigh         0.792     0.0811    9.77 1.50e-22  1.289     0.1272   10.14
ny:TypeApartment   -0.299     0.0742   -4.03 5.55e-05 -0.572     0.1192   -4.80
ny:TypeAtrium      -0.170     0.0977   -1.74 8.21e-02 -0.366     0.1552   -2.36
ny:TypeTerrace     -0.673     0.0951   -7.07 1.51e-12 -1.091     0.1515   -7.20
ny:ContHigh         0.106     0.0578    1.84 6.62e-02  0.360     0.0955    3.77

最初の4列は対数線形モデルからの推論であり、次の3列は比例オッズモデルからのものです。

これはおそらく最も重要な質問に答えます:どのようにしてそのようなモデルに適合するかです。RRに対するまれなイベントのORの相対的な概算を調査するために使用できると思います。


1

2つの質問に個別に対処しましょう。

ORが相対リスクを概算するための「まれな結果の仮定」は、通常のロジスティック回帰で依然として真実ですか?

あんまり。結果は4つのカテゴリ全体に均等に分散しているため、特に珍しいカテゴリはありません。

もしそうなら、相対リスクを直接推定するようにリンク関数を変更することは可能ですか?また、そのような場合の収束の問題に対処するために、ロバストな標準誤差を持つポアソン近似のようなものを使用することはまだ可能ですか?

可能ですが、モデルを使用して予測を行う場合、クラスに存在する予測確率は1を超える可能性があります。

標準の順序付けられたロジットモデルは 、比例オッズの仮定とともにで定式化されます。「ロジット」を「ログ」で置き換えるだけで、有効な推定値を生成する有効な尤度を持つ有効なモデルが生成されます。ただし、これらを実際のデータに適用すると、コンポーネントが複数になる可能性があります(これは比例オッズの仮定の範囲外であるため、それを使用して残りのデータを入力することはできませんコンポーネント)。β P I

Yicategorical(pi);logit(pi)=Xβ
βpi

これは、モデルを使用して、トレーニングされたデータを予測するだけの場合は発生しません。

  • あなたはたくさんのトレーニングデータを持っています
  • トレーニングデータは、共変量の可能なすべての組み合わせ(カテゴリカルの場合)または共変量の全範囲(数値の場合)をカバーします。

1
あなたは正しい標準の順序付けられたロジットモデルを書いたとは思いません。AgrestiまたはMcCullogh&Nelderのコピーはありますか?応答の分布が順序付けられたロジットカテゴリ間でさえある場合、近似は意味がないことに同意しました。しかし、ほとんどの参加者が最低の応答カテゴリに集まった場合はどうなるでしょうか。K
AdamO

1
@AdamOこれはおそらく慣れ親しんだ定式化ではありませんが、同等のものです(X切片が含まれている限り)。質問に最も関連性のあるポイントを強調するために選択しました。(logitをlogに置き換えると明らかに同等ではなくなりますが、この公式が最も一般化しているようです)
JDL

1
プロップオッズモデルには重要な制約があります。つまり、各カテゴリコントラストの切片項(図示せず)が順序付けされ、さらにはカテゴリ指定ですが、モデル化された確率は累積確率です。無条件のロジスティックモデルを記述しただけで、これは正しくありません。Yi
AdamO

これらの制約は、比例オッズの仮定によって対処されます。(私が述べた方程式ではそれらが表現されていないことに同意します)
JDL
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.