異なる従属変数に


2

従属変数を持つ線形回帰モデルがあるとします。そのR 2 yを見つけます。さて、別の回帰を行いますが、今回はlog y で、同様にその見つけます。どちらのモデルがより適しているかを確認するために、両方のを比較できないのはなぜですか?yRy2log(y) R 2Rlog(y)2R2

直観的には、ログによって変動性が減少するため、ログ変換を「追加」するとモデルは改善されます。

別の理由はありますか?また、この直感を形式化する方法はありますか?

任意の助けをいただければ幸いです。


従属変数のみを変換し、リグレッサを同じ状態に保ちますか?または、より一般的な「モデル選択基準としてを使用できますか?」R2
アレコスパパドプロス

ここに示されていない情報がない限り、がを改善すると考える特別な理由はありません。それは逆の効果があるかもしれませんlogR2
ヘンリー

@AlecosPapadopoulos同じ数のリグレッサーを保持しながら、両方のケースに興味があります。
海の老人。

@Henryは最初は、値が十分に大きければ(おそらく10 ^ 3以上ですか?)反対する傾向があります。対数変換は、その分散低減プロパティによって正確に知られています。
海の老人。

あなたの仮定データがあるとあなたデータがある4000 6000 8000。対数を取ると、R 2が減少しますx1000,2000,3000y4000,6000,8000R2
ヘンリー

回答:


1

は、モデルのデータへの適合を測定します。「モデルへのデータ」ではなく「データへのモデル」という文の順序に注意してください。2つの可能な方程式から選択する基準として R 2を使用します。あなたがここに投稿しているという事実は、おそらく誰かがあなたにそれをすることができないと言った、これが機能しないことをオンラインで読むことを意味します。事実、それは機能しますが、うまく機能しません。R2R2

計算方法のいくつかの側面により、R 2は不適切な基準になります。まず、これは、古典的な理由で、あなたが増加しなければならないすべてのR 2は、変数を追加しています。物理テストでの乳児のパフォーマンスに対する代用乳の影響を予測していて、完璧な色Dの価格を追加した場合、香港で取引されている3カラットのダイヤモンドはR 2が上がるかもしれませんが、下がりません。さらに、提案された変換の下で、平方の合計が変化します。このため、モデルの比較にF検定を使用するのにはあまり適していません。R2R2R2

これにより、AICとBICが表示されます。哲学的に、AICとBICは2つのモデルから選択するベイズ因子のアルゴリズム近似です。データは知っているが知らないので、このようなモデル選択に関する本を読むべきです。

ただし、提供した情報が限られている場合、少なくとも表面的には、AICまたはBICのどちらでも同等の結果が得られるように見えます。これは、モデルが2つしかなく、パラメーターの数が等しいためです。

以前にベイジアン法を使用したことがない場合、確率の方向が逆になります。モデルが真であると仮定して、データが特定の標準より極端または極端であるかどうかを判断する代わりに、データがランダムではなく固定され、モデルが不確実であると仮定し、そのために基づいて最適なパラメーターとモデルを選択しますデータ。帰無仮説はありません。そのため、AICまたはBICは、アルゴリズム規則に変換されたオッズの近似値です。

それらは2つの点で異なります。まず、BICは各モデルに「真」であるという事前確率を等しく与えますが、AICはパラメーターの数に比例する確率を与えるため、複雑なモデルは複雑であるとペナルティーを科されます。第二に、サンプルサイズが大きくない限り、AICがBICよりも複雑なモデルにペナルティを課さないように、尤度関数の近似が異なります。

本格的なベイジアン法ではなくどちらかのツールを使用する理由は、高速であり、ほとんどの状況でベイジアンソリューションへの適切な近似であり、ベイジアンモデル選択プロセスほど複雑ではないためです。

y=5x+7R2R2


0

R2R2=SSESSTR2=1SSRSSTSSESSRSSTR2SSESSRSSTR2現在、別の比較基準を使用しています。したがって、SSTが異なるという事実により、一般に異なる従属変数の比較はできません。これは理にかなっていますか?

R2


1
R2SSRSST

1
SSTR2

@AndrewMは正確に«「SSTを変更すると、R2はベースフリーではなくなることを意味するため、2つのメジャーを比較することは無意味です。」それできますか?答えてくれてありがとう。;)
海の老人。

0

簡単な答えは、異なる従属変数を比較することです。通常、これらは異なるモデルを意味し、その一部は通常の仮説を満たしていません。この場合、

  1. ytlog(yt)
  2. log(yt)yt

したがって、直線性を満たすことができるのは1つだけです。モデルを比較しても意味がありません。それらが仮説に準拠していることを確認した後、それらを比較するだけです。

データプロットまたは他の手法から、どちらが線形性に従うかを確認してから、その1つを選択できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.