線形回帰における線形性の仮定は単に


10

線形回帰を修正しています。

グリーンによる教科書はこう述べている:

ここに画像の説明を入力してください ここに画像の説明を入力してください

ここで、もちろん、線形回帰モデルにはなどの他の仮定があります。この仮定と線形性の仮定(実際にはdefinesを定義する)を組み合わせると、モデルに構造が適用されます。E(ϵ|X)=0ϵ

しかし、直線性の仮定自体によっては以来、私たちのモデルにどのような構造を入れていません完全に任意でよいです。変数X yについては、2つの関係が何であれ、線形性の仮定が成り立つようにϵを定義できますしたがって、線形性「仮定」は、仮定ではなく、実際にはϵの定義と呼ばれるべきです。ϵX,yϵϵ

したがって、私は不思議に思っています:

  1. グリーンはだらしないですか?彼は、実際に書かれている必要があります:?これは実際にモデルに構造を置く「線形性の仮定」です。E(y|X)=Xβ

  2. それとも私は、直線性の仮定がモデルに構造を置いていないことを受け入れなければならないだけ定義します他の仮定はのその定義に使用する、εをモデルに構造を置くことを?ϵϵ


編集:他の仮定については混乱があるようですので、ここに仮定の完全なセットを追加しましょう:

ここに画像の説明を入力してください

これはグリーン、計量経済分析、第7版からです。p。16。


4
これらは知覚的観察(+1)です。すべて公平に、しかし、私は(すべてではない)ほとんどの著者は非常に、フレームワーク内で作業していると考えているという意味のような添加剤のエラーのその分布を中心とするという仮定が含ま0をϵ0
whuber

2
@whuber、仮定のセット全体を追加しました。A3を見てください。A3は、グリーンA1は離れ定義から、すべての任意の論理的な内容を持っているかどうかの質問に私を残しA1、でこれを想定していないことを意味するものと思われる、それが0に中心があることを明示的になりϵ
user56834

2
前提条件のリストの意図された意味は、それらが個別にはなく集合的に保持されることです。これは「だらしさ」を示しません。
whuber

2
@AdamO、「正しい」という言葉は私には正確な意味を持たないようです。これをもっと正確に理解しようとしています。これらすべての最も正確な定式化は、仮定1は「定義」と呼ばれるべきであると言うことであると私には思われ、それからすべてが理にかなっています。または、実際に何かが足りないので、この質問をしました。残念ながら、これまでのところ、私はその質問に直接答えを見ていないϵ
user56834

2
@ Programmer2134あなたは不正確な質問をしているので不正確な答えを得ています。あなたが言うように「モデルに構造を置く」ことはありません。誤った平均モデル()が使用されている場合、応答はY = f x + バイアス+ エラーとして特徴付けられます。残差は、バイアスと誤差の合計と見なされます。f(x)Y=f(x)+bias+error
AdamO

回答:


8
  1. E(y|X)=Xβ

E(y|X)=Xβ

E(y|X)yE[Y|do(X)]

y=βx+γx2+ϵ

E[ϵ|x]=δxγx2

E[y|x]=βx

β=β+δy=βx+ϵE[ϵ|x]=0E[y|x]

  1. ϵϵ

ϵϵ:=yXβ=yE[Y|do(X)]ϵy XϵE[Y|do(X)]E[Y|X]

ϵX,yϵ

yxϵβ

サイドノート

ほとんどの計量経済学の教科書が、回帰方程式と構造方程式の違い、およびそれらの意味に関して混乱していることは、言及する価値があります。これは最近文書化されています。ここでChenとPearlによる論文のほか、Chris Auldによる拡張調査を確認できます。グリーンは調べた本の一つです。


ϵxxyxy ϵ

1
yXϵ:=yE[Y|do(X)]=yXβϵXϵX

ちなみに、@ Programmer2134、あなたの懸念は正しい方向に向かっています。因果関係の推論に関するパールの入門書は、グリーンの興味深い仲間かもしれません!
Carlos Cinelli、2018年

ちなみに、先ほどパールの 『因果関係:モデル、推論、推論』を読み始めました。とても面白いと思ったのですが、ちょっと抽象的なものでした。私は第2章を超えませんでした。「因果推論の入門書」の方が適していると思いますか (つまり、概念をより直感的に紹介します)。
user56834

1
E(Y|x)

0

OPとMatthew Druryによるコメントの後に編集

βy=f(x)y=a+bxy=a+bx2y=a+sin(x)。さらに、この仮定はベータに焦点を合わせているため、予測子(別名、独立変数)に適用されます。

E(ϵ|X)E(ϵ|X)=0yyϵE(ϵ|X)0xyE(ϵ|X)0

ϵE(ϵ|X)=0yyXϵϵE(ϵ|X)=0

要するに(確かに、グリーンの本を完全に読んで彼の議論をチェックせずに):

  1. y=Xβ+ϵE(ϵ|X)=Xβ
  2. 線形性の仮定は、モデルに何らかの構造を与えます。ただし、モデリング前の変換やスプラインなどの追加により、非線形関連付けを線形回帰フレームワークに適合させることができることに注意してください。

3
X(0,1)

1
f(y)f(x)

@NickCoxこれらのポイントを編集しました。
IWS 2018年

1
X

3
私はこれに同意しません。期待値の仮定は正常性とは無関係ですが、構造的線形性の仮定を理解するには絶対に必要です。それ以外の場合、opによって示されるように、線形性の仮定は無意味です。正規性の仮定はまったく異なる獣であり、多くの場合不要です。
Matthew Drury

-1

上記の答えに少し戸惑いましたので、もう一度お話しします。問題は、実際には「古典的な」線形回帰ではなく、その特定のソースのスタイルに関するものだと思います。古典的な回帰部分について:

ただし、線形性の仮定だけでは、モデルに構造はありません。

ϵX

E(y|X)=Xβ

最初の質問には答えたくありませんが、通常の線形回帰に必要な仮定をまとめておきます。

xiRdyiRi=1,...,n(xi,yi)(Xi,Yi)

  1. iβRdYi=βXi+ϵiiϵi

  2. ϵiϵiN(0,σ)σi

  3. X=(X1,...,Xn)Y=(Y1,...,Yn)X,Y(X,Y)fX,Y

これで、通常のパスを実行して計算できます

fY|X(y|x)=fY,X(y,x)/fX(x)=(12πd)nexp(i=1n(yiβxi)22σ)

logfY|X(y|x)β

ϵ

現在、さまざまな可能性があります。

  • 彼はこの仮定を本に書いていない。それからそれは本の誤りです。

  • +ϵϵ

    • 彼はあなたが引用している部分に密接にそれを書き留めます、そしてあなた/私たちはそれに気づきませんでした(可能性も:-))

fY|Xϵ


3
OLSを使用するために、エラーを正規分布する必要はありません。
user56834

(-1)エラーは正規分布である必要はありません。実際には、パラメーターの推定値を不偏にしたり、テストに一貫性を持たせるために、それらを独立させたり、まったく同じように分散させる必要はありません。OLSが正確なテストであるためには、はるかに厳しい仕様が必要です。
AdamO 2018年

ϵi

1
@FabianWernerモデルの選択は、尋ねられる質問に依存します。線形回帰は、一連のデータの1次の傾向、つまりXの違いをYの違いに関連付ける「経験則」を推定します。エラーが正常に分布しない場合、Lindeberg Feller CLTは、CIとPIがほぼ正しいことを保証します非常に小さなサンプルでも。エラーが独立していない(そして依存構造が不明である)場合、SEが正しくない可能性がありますが、推定は偏っていません。サンドイッチ誤差推定はこの問題を軽減します。
AdamO
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.