log(y)のモデリング時に回帰結果を逆変換する


11

回帰を適合させていますy 。指数変換によって変換ポイントの推定値(および信頼性/予測間隔)を逆算することは有効ですか?E [ f X ] f E [ X ] なので、私はそうは思わないが、他の人の意見が欲しかった。log(y)E[f(X)]f(E[X])

以下の私の例は、逆変換との競合を示しています(.239対.219)。

set.seed(123)

a=-5
b=2

x=runif(100,0,1)
y=exp(a*x+b+rnorm(100,0,.2))
# plot(x,y)

### NLS Fit
f <- function(x,a,b) {exp(a*x+b)} 
fit <- nls(y ~ exp(a*x+b),  start = c(a=-10, b=15)) 
co=coef(fit)
# curve(f(x=x, a=co[1], b=co[2]), add = TRUE,col=2,lwd=1.2) 
predict(fit,newdata=data.frame(x=.7))
[1] 0.2393773

### LM Fit
# plot(x,log(y))
# abline(lm(log(y)~x),col=2)
fit=lm(log(y)~x)
temp=predict(fit,newdata=data.frame(x=.7),interval='prediction')
exp(temp)
        fit       lwr       upr
1 0.2199471 0.1492762 0.3240752

1
これは、ログリンクされたガウスGLMによって解決される問題の1つではありませんか?
generic_user 2014

@ARMはい、そう思います。ご指摘いただきありがとうございます。ただし、GLMを使用すると予測間隔を取得するのが難しくなりますが、うまくいくと思います。
グレン

1
@GlenこのサイトでDuanにじみを検索します。
Dimitriy V.Masterov 2014

回答:


13

それはあなたがもう一方の端で何を取得したいかによります。

変換されたパラメーターの信頼区間は、うまく変換されます。対数スケールで名目カバレッジがある場合、変換の単調性のため、元のスケールで同じカバレッジに戻ります。

将来の観測の予測間隔もうまく変換されます。

対数スケールの平均の間隔は、通常、元のスケールの平均の適切な間隔にはなりません。

ただし、対数スケールのモデルから、元のスケールの平均の正確な推定値またはおおよその平均値を作成できる場合があります。

ただし、注意が必要です。そうしないと、多少意外な特性を持つ見積もりが生成される可能性があります(たとえば、それ自体に母集団の平均がない見積もりを生成することは可能です。これは、すべての人が良いことをしているわけではありません)。

exp(μi)exp(μi+12σ2)exp(μi^)exp(12σ2)

σ2

σ^2σ2exp(μi^)exp(12σ^2)exp(μi^)exp(12σ2)μi^μiexp(μi^)exp(μi)

こちらをご覧ください

関連する投稿:

MLRモデルの逆変換

逆変換

逆変換された信頼区間


1
おかげで、私は以前の投稿を見て、悟りながら、まだやや混乱していたので、私の質問をしました。
グレン

12σ2^

1
E(Y)=0yf(y)dyfE(eX)X=logYXYt1,2,...

1
exetxe...x12

1
teμt+12σ2t2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.