標準化されたベータを元の変数に戻す


13

これはおそらく非常に単純な質問だと思いますが、検索した後、探している答えが見つかりません。

ベータのリッジ推定値を計算するために変数を標準化する必要がある(リッジ回帰)必要があるという問題があります。

次に、これらを元の変数スケールに戻す必要があります。

しかし、どうすればよいですか?

私は二変量のケースの式を見つけました

β=β^SxSy.

これは、D。グジャラート語、Basic Econometrics、175ページ、式(6.3.8)で与えられました。

ここで、は標準化された変数で実行された回帰からの推定量であり、は同じ推定量を元のスケールに変換して戻し、はの標本標準偏差、は標本標準偏差です。* β S 、Y S 、Xββ^SySx

残念ながら、この本では、重回帰の類似の結果については説明していません。

また、私は二変量のケースを理解しているのかわかりませんか?単純な代数操作により、元のスケールでの式が得られます。β^

β^=βSySx

既にによってデフレートされている変数で計算されたが、再度変換するためにによってデフレートするますか?(さらに、平均値が追加されないのはなぜですか?) SXSXβ^SxSx

では、結果を理解できるように、多変量のケースでこれをどのように導関数を使用して理想的に説明することができますか?

回答:


25

標準化された変数を使用する回帰モデルの場合、回帰直線には次の形式を想定します

E[Y]=β0+j=1kβjzj,

ここで、はj番目の(標準化された)リグレッサであり、からサンプル平均を差し引き、サンプル標準偏差除算することにより生成され: X J ˉ X J SのJ Z軸J = X jの - ˉ X Jzjxjx¯jSj

zj=xjx¯jSj

標準化されたリグレッサを使用して回帰を実行すると、近似された回帰直線が得られます。

Y^=β^0+j=1kβ^jzj

ここで、標準化されていない予測子の回帰係数を見つけたいと思います。我々は持っています

Y^=β^0+j=1kβ^j(xjx¯jSj)

並べ替えて、この式は次のように書くことができます

Y^=(β^0j=1kβ^jx¯jSj)+j=1k(β^jSj)xj

ご覧のように、非変換変数を使用した回帰の切片は、によって与えられます。番目の予測子の回帰係数はです。β^0j=1kβ^jx¯jSjjβ^jSj

提示されたケースでは、予測変数のみが標準化されていると想定しました。応答変数も標準化する場合、共変量係数を元のスケールに変換し直すには、指定した参照からの式を使用します。我々は持っています:

E[Y]y^Sy=β0+j=1kβjzj

回帰を実行すると、当てはめられた回帰方程式が得られます

Y^scaled=Y^unscaledy¯Sy=β^0+j=1kβ^j(xjx¯jSj),

ここで、近似値は標準化された応答のスケールにあります。それらをスケール解除し、変換されていないモデルの係数推定値を復元するには、方程式にを乗算し、標本平均を反対側に移動します。Syy

Y^unscaled=β^0Sy+y¯+j=1kβ^j(SySj)(xjx¯j).

したがって、応答も予測子も標準化されていないモデルに対応する切片は、 、対象のモデルの共変量係数は、各係数にを乗算することで取得できます。SY/SJβ^0Sy+y¯j=1kβ^jSySjx¯jSy/Sj

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.