従属変数の変換に


10

従属変数を持つ線形回帰モデルがあると想像してください。そのR 2 yを見つけます。ここで、別の回帰を行いますが、今回はlog y で、同様にR 2 log y )を見つけます。R 2を比較してどちらのモデルが適しているかを確認することはできないと言われました。何故ですか?私に与えられた理由は、異なる量(異なる従属変数)の変動性を比較するためです。これが十分な理由であるかどうかはわかりません。yRy2log(y)Rlog(y)2R2

これを形式化する方法もありますか?

任意の助けいただければ幸いです。


1
これは以前に相互検証で議論されたのではないかと思います。同様のスレッドを徹底的に調べましたか?また、異なる従属変数(GDP対原油価格など)または同じ変数の変換(GDP対GDP成長)、またはその両方に関心がありますか?
Richard Hardy

@RichardHardyいくつか見つけましたが、私の質問に正直だったと思います。このように:stats.stackexchange.com/questions/235117/… 答えは単に「はい」とだけ述べており、その理由を実際に説明していません。
海の老人。

@RichardHardy従属変数の変換に興味があります。
海の老人。

1
比較は、ネストされたモデル間でのみ意味があります。R2
LVRao

@LVRaoコメントありがとうございます。なぜそうなのですか?
海の老人。

回答:


8

「数量が異なる」ということはあまり説明になりそうにないので、これは良い質問です。

を使用してこれらのモデルを比較する場合は注意が必要な2つの重要な理由があります。粗すぎて(実際に適合度を評価しいない)、少なくとも1つのモデルには不適切です。この返信は、2番目の問題に対処しています。R2


理論上の扱い

は、モデル残差の分散と応答の分散を比較します。分散は、フィットからの平均二乗加法偏差です。したがって、 R 2は応答 yの 2つのモデルを比較するものとして理解できます。 R2R2y

「ベース」モデル

(1)yi=μ+δi

μδiτ2

xi

(2)yi=β0+xiβ+εi.

β0βεiσ2

R2τ2σ2τ2

対数を取り、最小二乗法を使用してモデルを近似すると、暗黙的に次の形式の関係が比較されます。

(1a)log(yi)=ν+ζi

フォームのいずれかに

(2a)log(yi)=γ0+xiγ+ηi.

(1)(2)(2a)

yi=exp(log(yi))=exp(γ0+xiγ)exp(ηi).

exp(ηi)yi=exp(γ0+xiγ)

Var(yi)=exp(γ0+xiγ)2Var(eηi).

xi(2)σ2

(1a)(2a)(1)(2)R2R2

分析

R2xyεiηi

このようなモデル(一般に発生します)は、指数関係に適合する最小二乗法です。

(3)yi=exp(α0+xiα)+θi.

yx(2a)θi(2)R2xy

(3)300xi1.01.6(x,y)(x,log(y))

散布図

R20.700.56R2R20.70


log(y)(3)


R ^ 2に対する批判は公平ではありません。すべてのツールとして、その使用法をよく理解する必要があります。上記の例では、R ^ 2が正しいメッセージを提供しています。R ^ 2はある意味でより良い信号対雑音比を選択しています。もちろん、スケールがまったく異なる2つのグラフを並べて配置するのは明らかではありません。実際には、左側の信号はノイズ偏差と比較して非常に強いです。
Cagdas Ozgenc

@Cagdasあなたは本質的に矛盾したメッセージを提供しているようです。2つのプロットは必然的に2つの異なるスケールで表示されます-1つは元の応答をプロットし、もう1つはそれらの対数をプロットします-次に、この避けられない事実があなたのケースをサポートしていないように見えるため、何かが「明白でない」と主張します。この答えが「不公平」であると不平を言うことは、私が提供したモデルの明示的な分析に照らしても、実際には成り立ちません。
whuber

私が言っていることに矛盾はありません。R ^ 2は、より高い信号対雑音比を選択します。それはそれがしていることです。それを別のものに変えようとして、それが機能していないと主張することは全く間違っています。R ^ 2に対するすべての批判は、別の応答変数に適用される場合、他の適合度インジケーターにも適用されますが、何らかの理由でR ^ 2がスケープゴートとして選択されています。
Cagdas Ozgenc 2017年

R2R2R2

2
あなたの助けwhuberをありがとう。受付が遅くなってすみません、最近は暇があまりありません。;)
海の老人。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.