パネル/縦断データを使用して回帰分析でデータを標準化することをお勧めしますか?


16

一般に、係数を適切に比較するために、回帰の独立変数を標準化します(このように、それらは同じ単位:標準偏差を持ちます)。ただし、パネル/縦断データでは、特に階層モデルを推定する場合、データを標準化する方法がわかりません。

それが潜在的な問題になる理由を見るために、期間に沿って個人があり、従属変数と1つの独立変数を測定したと仮定します。。完全なプーリング回帰を実行する場合、次のようにデータを標準化しても構いません:、t-統計。一方、プールされていない回帰、つまり個人ごとに1つの回帰を当てはめる場合は、データセット全体(Rコード)ではなく、個人のみでデータを標準化する必要があります。=1nt=1Tytバツtバツz=バツ平均バツ/SDバツ

for (i in 1:n) {
  for ( t in 1:T) x.z[i] =  (x[i,t] - mean(x[i,]))/sd(x[i,]) 
}

ただし、個人によるさまざまな切片を持つ単純な階層モデルに適合する場合、収縮推定量を使用します。つまり、プール回帰と非プール回帰の間でモデルを推定します。データを標準化するにはどうすればよいですか?プールされた回帰のようにデータ全体を使用していますか?プールされていない場合のように、個人のみを使用していますか?

回答:


10

標準化が通常の回帰または縦断モデルで良いアイデアであることはわかりません。予測の取得が難しくなり、通常、解決が必要な問題を解決しません。そして、モデルにとがある場合はどうでしょう。どのように標準化しますか?モデルに連続変数とバイナリ変数がある場合はどうなりますか?バイナリ変数をどのように標準化しますか?確かに、標準偏差によるものではないため、低い有病率の変数がより重要になります。バツバツ2バツ2

一般的に、元のスケールでモデル効果を解釈するのが最善です。バツ


@Frank Harrell-あなたが概説した条件に関連する問題についての良い点ですが、異なるスケールのすべての連続変数がある場合、勾配を比較する唯一の方法は標準化ではありませんか?
DQdlM

1
@Frank、実行しているモデルのタイプに依存すると思いますが、予測変数の標準化はしばしば有用です。それらを中央に配置すると、平均予測結果とさまざまな予測変数の相対的な重要性がより明確になるため、インターセプトが解釈可能になります。通常、バイナリ予測変数はそのままにしますが、他のスケーリングオプションを検討する価値がある場合もあります。最後に、場合によっては、大幅に異なる標準偏差を持つ予測変数があると、計算/収束の問題につながる可能性があります。
マイケルビショップ

2
そのような標準化がいかに明確にするのかは明確ではありませんが、明確にするのではありません。また、平均値は、相対的な重要性(分散措置の選択は、さらに問題がある?中央?モード?第43パーセンタイル)を中心とするための当然の選択ではない多くの方法で判断することができ、例えば、部分、部分的、四分位範囲の共変量効果、...また、Rがボンネットの下で使用するような最新の行列数学ルーチンを使用する場合、標準化が計算に役立つこともわかりませんでした。ケニーは、標準化は勾配を比較する方法ではないことに注意してください。R2χ2
フランクハレル

1
バイナリ変数がある場合は、それらを標準化せず、連続変数のみを標準化します。Gelmanによるこの記事(< stat.columbia.edu/~gelman/research/published/standardizing7.pdf >を参照して、変数を2つの標準偏差で除算することを提案します。いずれにせよ、ベイジアンモデルを近似する場合は収束に役立ちます。
マノエルガルディーノ

そして、元のスケールで効果を解釈する方が良い理由がわかりません。ロジスティック回帰に対するGDPの効果は、係数のみに注目することを解釈するのは困難です。これは、GDPが確率スケールよりもはるかに大きいためです。相互作用は、標準化された係数または中心変数によってよりよく理解されます。最後に、と場合、この場合は標準化しないでください。バツバツ2
マノエルガルディーノ

0

異なるスケールで測定された変数を同じメトリックにもたらす標準化の代替手段があります。これは、最大スケーリングの割合(POMS)と呼ばれ、z変換が行う傾向があるため、多変量分布を混乱させることはありません。

Todd Littleは、縦構造方程式モデリングに関する本で、Z標準化よりもPO​​MSを明示的に推奨しています。Z変換には、縦断データを処理するときに追加の問題が伴います。こちらをご覧くださいhttps : //www.ncbi.nlm.nih.gov/pmc/articles/PMC4569815/

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.