回答:
GLiMには多数の疑似があります。優れたUCLA統計ヘルプサイトには、ここでそれらの包括的な概要があります。リストするものはMcFaddenの擬似R 2と呼ばれます。UCLAの類型と比較すると、ヌルモデルよりも近似モデルの改善を指標付けするという意味では、R 2に似ています。いくつかの統計ソフトウェア、特にSPSSは、正しく思い出すと、デフォルトでMcFaddenの擬似R 2をロジスティック回帰などの分析の結果とともに出力するため、Cox&SnellおよびNagelkerke擬似R 2 R 2 sはさらにそうかもしれません。ただし、マクファデンの擬似の特性の全て有していない(全く擬似R 2はません)。誰かが疑似使用に関心がある場合R 2:モデルを理解するために、私は強く、この優れたCVスレッド読んでお勧め擬似R 2尺度はロジスティック回帰(コックス&スネルまたはNagelkerke)のレポートに1があるの? (何それの価値について、R 2、人々が実現よりも、それ自体は、ここでは、@ whuberの答えで見ることができるの偉大なデモンストレーションslipperierです:あるR 2?便利または危険)
Rは出力にヌルと残差を与えます。glm
これにより、この種の比較を正確に行うことができます(以下の最後の2行を参照)。
> x = log(1:10)
> y = 1:10
> glm(y ~ x, family = poisson)
>Call: glm(formula = y ~ x, family = poisson)
Coefficients:
(Intercept) x
5.564e-13 1.000e+00
Degrees of Freedom: 9 Total (i.e. Null); 8 Residual
Null Deviance: 16.64
Residual Deviance: 2.887e-15 AIC: 37.97
model$null.deviance
およびを使用して、これらの値をオブジェクトから引き出すこともできます。model$deviance
あなたが提案した式は、ロジスティックモデルの2乗Rを推定するためにMaddala(1983)とMagee(1990)によって提案されました。したがって、すべてのglmモデルに適用できるとは思いません(266ページのThomas P. Ryan著の「Modern Regression Methods」を参照)。
偽のデータセットを作成すると、Rの2乗を過小評価していることがわかります。たとえば、ガウスglmの場合です。
ガウスグラムでは、基本(lm)R二乗公式を使用できると思います...
R2gauss<- function(y,model){
moy<-mean(y)
N<- length(y)
p<-length(model$coefficients)-1
SSres<- sum((y-predict(model))^2)
SStot<-sum((y-moy)^2)
R2<-1-(SSres/SStot)
Rajust<-1-(((1-R2)*(N-1))/(N-p-1))
return(data.frame(R2,Rajust,SSres,SStot))
}
そして、ロジスティック(またはrの二項族)については、あなたが提案した式を使用します...
R2logit<- function(y,model){
R2<- 1-(model$deviance/model$null.deviance)
return(R2)
}
これまで、ポアソンglmについては、この投稿の式を使用しました。
リサーチゲートで利用可能な疑似R2に関する優れた記事もあります...リンクはこちらです:
これが役立つことを願っています。
1-summary(GLM)$deviance/summary(GLM)$null.deviance
と、R2が通常のOLS回帰のR2値と一致することがわかります。したがって、上記の答えは正しいです。ここにも私のポストを参照してください- stats.stackexchange.com/questions/412580/...
Rパッケージは、David J. Harrisが述べたようにD-Squared
をmodEvA
計算します1 - (mod$deviance/mod$null.deviance)
set.seed(1)
data <- data.frame(y=rpois(n=10, lambda=exp(1 + 0.2 * x)), x=runif(n=10, min=0, max=1.5))
mod <- glm(y~x,data,family = poisson)
1- (mod$deviance/mod$null.deviance)
[1] 0.01133757
library(modEvA);modEvA::Dsquared(mod)
[1] 0.01133757
モデルのD二乗または説明された逸脱は(Guisan&Zimmermann 2000)https://doi.org/10.1016/S0304-3800 (00)00354-9で紹介されてい ます
Colin Cameron, A., & Windmeijer, F. A. (1997). An R-squared measure of goodness of fit for some common nonlinear regression models. Journal of Econometrics, 77(2), 329-342.