順序ロジスティック回帰の解釈


17

この順序ロジスティック回帰をRで実行しました。

mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars)

私はこのモデルの概要を得ました:

summary(mtcars_ordinal)

Re-fitting to get Hessian

Call:
polr(formula = as.factor(carb) ~ mpg, data = mtcars)

Coefficients:
      Value Std. Error t value
mpg -0.2335    0.06855  -3.406

Intercepts:
    Value   Std. Error t value
1|2 -6.4706  1.6443    -3.9352
2|3 -4.4158  1.3634    -3.2388
3|4 -3.8508  1.3087    -2.9425
4|6 -1.2829  1.3254    -0.9679
6|8 -0.5544  1.5018    -0.3692

Residual Deviance: 81.36633 
AIC: 93.36633 

次のmpgような係数の対数オッズを取得できます。

exp(coef(mtcars_ordinal))
 mpg 
0.7917679 

そして、しきい値の対数オッズは次のとおりです。

exp(mtcars_ordinal$zeta)

       1|2         2|3         3|4         4|6         6|8 
0.001548286 0.012084834 0.021262900 0.277242397 0.574406353 

このモデルの私の解釈が正しいかどうかを誰かに教えてもらえますか:

ようにmpg1個の単位だけ増加のカテゴリ1から移動するのオッズcarb他の5つのカテゴリーのいずれかには、-0.23減少します。対数オッズが0.0015のしきい値を超える場合、自動車の予測値はのカテゴリ2になりますcarb。対数オッズが0.0121のしきい値を超える場合、自動車の予測値はカテゴリ3になり、以下同様に続きますcarb

回答:


10

オッズとログオッズは完全に混同されています。対数オッズは係数です。オッズは指数係数です。また、オッズの解釈は逆になります。(私は限られた従属変数について考えて計量経済学で育った、と順序回帰のオッズ解釈はある...オム...私に楽しま。)あなたの最初の文は、読まなければならないのでとして」 mpg 1単位ずつ増加、オッズ 他の5つのカテゴリ比較してカテゴリ1を観察するcarb 割合が21%増加します。」

しきい値の解釈に関する限り、モーダル予測とは何かを理解できるように、予測曲線をすべてプロットする必要があります。

mpg   <- seq(from=5, to=40, by=1)
xbeta <- mpg*(-0.2335)
logistic_cdf <- function(x) {
  return( 1/(1+exp(-x) ) )
}

p1 <- logistic_cdf( -6.4706 - xbeta )
p2 <- logistic_cdf( -4.4158 - xbeta ) - logistic_cdf( -6.4706 - xbeta )
p3 <- logistic_cdf( -3.8508 - xbeta ) - logistic_cdf( -4.4158 - xbeta )
p4 <- logistic_cdf( -1.2829 - xbeta ) - logistic_cdf( -3.8508 - xbeta )
p6 <- logistic_cdf( -0.5544 - xbeta ) - logistic_cdf( -1.2829 - xbeta )
p8 <- 1 - logistic_cdf( -0.5544 - xbeta )

plot(mpg, p1, type='l', ylab='Prob')
  lines(mpg, p2, col='red')
  lines(mpg, p3, col='blue')
  lines(mpg, p4, col='green')
  lines(mpg, p6, col='purple')
  lines(mpg, p8, col='brown')
  legend("topleft", lty=1, col=c("black", "red", "blue", "green", "purple", "brown"), 
         legend=c("carb 1", "carb 2", "carb 3", "carb 4", "carb 5", "carb 6"))

ここに画像の説明を入力してください

3番目のカテゴリの青い曲線は検出されず、6番目のカテゴリの紫色の曲線も検出されませんでした。したがって、mpg27 を超える値の場合、最も可能性の高いカテゴリは1です。18〜27、カテゴリ2。4〜18、カテゴリ4。4以下、カテゴリ8。(あなたが勉強しているのは何だろう-商用トラックですか?最近の乗用車のほとんどはmpg> 25を持っているはずです)。交点をより正確に判断しようとする場合があります。

また、1、2、3、4、6(5をスキップ)、8(7をスキップ)の奇妙なカテゴリがあることに気づきました。5と7が設計上欠けていた場合、それは問題ありません。これらがcarb単に当てはまらない有効なカテゴリである場合、これは良くありません。


「carbのカテゴリ1から他の5つのカテゴリへの移動」の使用方法に注意してください。これは間違っていますか?「mpgが1ユニット増加するにつれて、炭水化物のカテゴリ1を観察する確率が他の5つのカテゴリと比較して21%増加する」と把握するのに苦労しています。これは、約5個の単位でのmpgが増加した場合、カテゴリ1を観測し、100%の確率があるでしょう。しかし燃費が5台増加している場合、カテゴリー1、カテゴリー8のない観察の高いチャンスがあるべきことを意味
ルチアーノ・

3
図を追加しました。私はそれがあなたの答えを解釈しやすくするのではないかと疑っています。(ところで、?mtcarsのドキュメントは、データがMotor Trendsの1974年問題からのテスト結果であると述べています。)
グング-モニカ

誰かがルチアーノの最後の質問に答えてくれませんか?これは非常に興味深いと思います。
エロセニン14年

1
mpg増加すると、あなたは、カテゴリのいずれかに該当する可能性が高くなって、X-β軸に左に移動します。そして、オッズ解釈は理にかなって:オッズがあった場合に2:1(すなわち、 VS 2つの結果のためには)、その後、100%の増加がある4:1(すなわち、対 2つの結果のために)23134515
StasKを

1
polr定義するモデルlogit P(Y <= k | x) = zeta_k - etaStasKの解釈@読み取るべきではない、「として mpg 1個の単位だけ増大、のカテゴリ1の観察の確率 carb 対他の5つのカテゴリーが増加26% (exp(-(-0.2335)) = 1.26)。」
モレモ

3

順序付けられたロジットモデルでは、オッズは特定のしきい値を下回るカテゴリにある確率と同じしきい値を超えるカテゴリにある確率の比を形成します(たとえば、3つのカテゴリ:カテゴリAまたはBにある確率vs C、およびカテゴリAとBまたはCに属する確率)。

これはlogit P(Y <= k | x) = zeta_k - eta、の説明で指定されているモデルにつながりますpolr()。したがって、オッズ比は、異なるカテゴリまたは異なるリグレッサーのいずれかに対して構築できます。後者は、より一般的なもので、同じカテゴリのオッズを比較しますが、異なるリグレッサと等しい

odds(yak|xa)odds(ybk|xb) = exp((ηaηb)).

さまざまなカテゴリのオッズ比は次のように定義されます

odds(yik|xi)odds(yim|xi) = exp(ζkζm),

これにより、比率はリグレッサに依存しません。このプロパティは、代替名の比例オッズモデルにつながります。

この単純ですが、あまり直感的ではない例では、次のように定式化できます:リグレッサーの1単位の増加に対して、mpgカテゴリ1を観察するオッズと上位のカテゴリを観察するオッズ(または特定のしきい値を下回るカテゴリを観察するオッズvs.同じしきい値を超えるカテゴリを観察すると)1.26倍されるか、26%増加しexp(-(-0.233 - 0)) = 1.263ます()。異なるカテゴリのオッズ比を定式化する場合、たとえば、カテゴリ1または2にあるオッズと上記のカテゴリにあるオッズとを比較して、カテゴリ1にあるオッズを上記のカテゴリと比較することができますexp((-6.470) - (-4.415)) = 0.128。これにより、後者の解釈はこの特定のセットアップではあまり役に立ちません。さまざまなカテゴリのオッズ比の例は、高校に行くオッズと比較した大学に行くオッズです。

最後に、次に高い応答カテゴリに到達するために説明変数をどれだけ変更する必要があるか興味があります。このために、区間の長さと係数を比較します。これにより、カテゴリから上位のカテゴリに応答を移動するために、それぞれのリグレッサーの変更がどれだけ大きくなければならないかがわかります。(ζkζk1)k

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.