ロジスティック回帰からの予測を理解する


13

ロジスティック回帰モデル(Rのglm)からの予測は、予想どおり0と1の間に制限されていません。ロジスティック回帰の私の理解は、入力パラメーターとモデルパラメーターが線形に組み合わされ、ロジットリンク関数を使用して応答が確率に変換されることです。ロジット関数は0と1の間に制限されているため、予測は0と1の間に制限されると予想しました。

ただし、Rでロジスティック回帰を実装すると、これは見られません。

data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model    <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub, 
                family = binomial(link = "logit"))
hist(predict(model))

ここに画像の説明を入力してください

どちらかといえば、predict(model)の出力は私には正常に見えます。誰かが私が得る値が確率ではない理由を私に説明できますか?


3
以下のCoroneの回答は、詳細を非常にうまくカバーしています。プレゼント数学(リンク関数を介してバックを渡すことによって、すなわちCoroneの答えどおり)の確率に変換することができ、x軸上の対数オッズ値を、上記のあなたが持っている本来のフィギュア
ジェームズ・スタンレー

回答:


16

このpredict.glmメソッドは、デフォルトで線形予測子のスケールで予測子を返します。すなわち、彼らはまだリンク機能を通過していません。

試してみる

hist(predict(model, type = "response"))

代わりに

ここに画像の説明を入力してください


4
マークアップとイラストの機能を短時間で習得できました。この答えはその良い例です。よくやった!
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.