回帰におけるWaldテスト(OLSおよびGLM):t分布とz分布


22

回帰係数のWald検定は、漸近的に保持される次のプロパティに基づいていることを理解しています(たとえばWasserman(2006):All Statistics、pages 153、214-215): ここで推定回帰係数を示し、は回帰係数の標準誤差を示し、は係数の値をテストするために関心のある値(は通常0です) 0とは大きく異なります)。サイズようワルドテストがある:リジェクト場合β^SEββ0β0αH0| W| >Zα/2

(β^β0)se^(β^)N(0,1)
β^se^(β^)β0β0αH0|W|>zα/2ここで、
W=β^se^(β^).

ただしlm、Rで線形回帰を実行する場合、回帰係数が0(with )と大きく異なるかどうかをテストするために、値の代わりに値が使用されます。さらに、in R の出力は、テスト統計として値と値を提供する場合があります。明らかに、分散パラメータが既知であると想定される場合は値が使用され、分散パラメータが推定される場合は値が使用されます(このリンクを参照)。z z t z ttzsummary.lmglmztzt

係数とその標準誤差の比率が標準正規分布として分布していると想定されているのに、なぜWald検定に分布が使用されることがあるのか、誰か説明できますか?t

質問に答えた後に編集する

この投稿は、質問に役立つ情報も提供します。


2
報告されている検定統計量は、必ずしもWald検定であると思われますか?
Glen_b-モニカを復元

3
値または値は常に、およびの標準誤差で除算された係数であるためです。tztlmglm
COOLSerdash

回答:


20

glmポアソン分布を使用すると、ポアソン分布では平均値と分散パラメーターが同じになるため、値が出力されます。ポアソンモデルでは、1つのパラメーター()のみを推定する必要があります。平均分散の両方のパラメーターを推定する必要がある場所では、分布が使用されていることがわかります。λ トンzλglmt

標準線形回帰の場合、誤差項は正規分布していると仮定します。ここでは、分散パラメーターを推定する必要があります。したがって、検定統計量に分布を使用します。エラー項の母分散を何らかの方法で知っている場合は、代わりに検定統計量を使用できます。ztz

投稿で言及したように、テストの分布は漸近的に正規です。 -distributionは漸近的に正常であるので、大きなサンプルでは、差は無視できるであろう。t


3

GLMフレームワークでは、一般に、あなたが述べたW検定統計量は漸近的に 正規分布しているため、Rにz値が表示されます。

通常の分散応答変数との線形モデル、すなわちA GLMを扱うときにそれに加えて、検定統計量の分布があるスチューデントのtそうで、Rあなたが持っているのt値を。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.