OLS推定量を導出するための仮定


14

誰かが私のために簡単に説明できますか、なぜOLS推定量を計算するために6つの仮定のそれぞれが必要ですか?多重共線性についてのみ見つけました。それが存在する場合、マトリックスを反転(X'X)できず、全体の推定量を推定できません。その他(線形性、ゼロ平均誤差など)はどうですか?



1
概念的な説明をお探しですか、それとも数学的なデモンストレーションが必要ですか?
GUNG -復活モニカ

4
通常の最小二乗は数値的な手順であり、それを計算するのに多くの仮定は必要ありません(可逆性は別として)。仮定が正当化するために必要な推論:昨日私の答えを参照して、それをもとにしstats.stackexchange.com/questions/148803/...
HalvorsenのはKjetil B

1
正確にどの「6つの仮定」に言及していますか?あなたは3つだけ言及します。
whuber

1)線形性2)多重共線性の欠如3)ゼロ平均誤差4)球面誤差(同相性および非自己相関)5)非確率的回帰変数および6)正規分布を参照します。したがって、以下の回答から理解したように、推定量を導き出すために最初の3つだけが必要であり、その他は推定量が青であることを確認するためにのみ必要です。
-Ieva

回答:


23

完全な多重共線性がある場合を除き、OLS推定量はいつでも計算できます。この場合、X行列には完全な多重線形依存性があります。その結果、フルランクの仮定が満たされず、可逆性の問題のためにOLS推定量を計算できません。

技術的には、OLS推定量を計算するために他のOLSの仮定は必要ありません。ただし、ガウス–マルコフの定理によれば、推定器が青になるためには、OLSの仮定(clrmの仮定)を満たす必要があります。

ガウス–マルコフの定理とその数学的導出の詳細な議論はここにあります:

http://economictheoryblog.com/2015/02/26/markov_theorem/

さらに、OLSの前提の概要、つまり、その数、必要なもの、単一のOLSの前提に違反した場合の動作を探している場合は、ここで詳細な説明を見つけることができます。

http://economictheoryblog.com/2015/04/01/ols_assumptions/

それがお役に立てば幸いです!


14

以下は単純な断面に基づいています。時系列とパネルでは多少異なります。

  1. 母集団、したがってサンプルでは、​​モデルは次のように記述できます これは、時々誤解された直線性の仮定、です。すなわち、 -モデルパラメータで線形であるべきであるβKxを使って好きなことを自由に行うことができます
    Y=β0+β1x1++βkxk+u=Xβ+u
    βk自体を使用。対数、二乗など。これが当てはまらない場合、モデルはOLSで推定できません。他の非線形推定器が必要です。xi
  2. ランダムサンプル(断面用)これは、推論およびサンプルプロパティに必要です。これは、OLSの純粋なメカニズムにはやや無関係です。
  3. 完全な共線性がないこれは、間に完全な関係が存在できないことを意味します。これは、X X 1のようにX X が特異でないことを保証する仮定ですxi(XX)(XX)1が存在する。
  4. ゼロ条件付き平均:。これは、次のようにモデルを適切に指定したことを意味します。省略された変数がなく、推定した関数形式が(未知の)母集団モデルに対して正しいこと。これが実際に有効であるかどうかを知る方法がないため、これは常にOLSの問題のある仮定です。E(u|X)=0
  5. エラー項の分散は一定であり、すべての条件とします:V a r u | X = σXi OLSの力学のために再びこの手段は何も、それは通常の標準誤差が有効であることを確認してください。Var(u|X)=σ2
  6. 正常; エラー用語Uは独立している、及び以下のUをN 0 σ 2。再び、これは、OLSのメカニズムとは無関係であるが、サンプリングの分布ことを保証β kが正常で、^ β KN β KV R ^ β KXiuN(0,σ2)βkβk^N(βk,Var(βk^))

次に、意味合いについて説明します。

  1. 1-6(古典的な線形モデルの仮定)の下でOLSはBLUE(最良の線形不偏推定量)であり、分散が最も低いという意味で最適です。また、すべての線形推定器、およびxの何らかの関数を使用するすべての推定器の間で効率的です。さらに重要なことは、1-6の下で、OLSは最小分散不偏推定量でもあります。つまり、すべての不偏推定量(線形だけでなく)の中で、OLSの分散が最小になります。OLSも一貫しています。

  2. 1-5(Gauss-Markovの仮定)の下では、OLSは青で効率的です(上記のとおり)。

  3. 1-4未満では、OLSは公平で一貫性があります。

実際、OLSはよりも弱い仮定の下で、つまり1 E u = 0および2 C o v x ju = 0という一貫性もあります。仮定4との違いは、この仮定では、機能的な関係を完全に打ち消す必要がないことです。(4)(1) E(u)=0(2) Cov(xj,u)=0


ゼロ平均条件については、あまりにも暗い絵を描いていると思います。バイアスがある場合、偏差の二乗の合計を最小化することは適切ではありませんが、逆に、回帰式をシフトすることでバイアスを捕捉できます(バイアスを吸収します)。あなたはない 4が両方検証することは不可能と無視することは容易である、つまり、平均値0を持っています。β0
user3697176

申し訳ありませんが、同意しません。それとも私はあなたを誤解していますか?エラボレートするか、参考にしてください。
レプマット

私はOPがに興味を持っていなかったと信じて(例えば、リッジ回帰など)約意図的に歪んだ推定を、話していない。私は、フォームのモデルについて話していいくつかの奇妙な理由のために--- ---で残留εは平均ありα 0を。この場合には、正式な変換を行うことが容易であり、Y = α + β 0 + β 1 X 1 + ...y=β0+β1x1++βxxn+ϵϵα0、ここで ηの平均はゼロです。y=α+β0+β1x1++βxxn+ηη
-user3697176

@ user3697176あなたが書いたものは正しくありません。理由を説明する回答を投稿しました。
アレコスパパドプロス

仮定1が満たされない場合、OLSを使用して母集団の共分散を推定することはできません(線形関係がないことがわかっていても)。
最大

7

別の質問のコメントでは、条件の重要性について疑問が提起され、回帰仕様に定数項を含めることで修正できるため、「簡単に無視できる」と主張しています。E(uX)=0

そうではありません。回帰に定数項を含めることで、この条件付き平均が既に定数であり、リグレッサの関数ではないと仮定した場合、誤差項のゼロ以外の条件付き平均を吸収します。これがなされなければならない重要な仮定である独立して、我々は定数項を含めるかどうかを:

E(uX)=const.

これが成立する場合は、その後、非ゼロ平均は、我々は単に定数項を含むことによって解決することができます迷惑になります。

しかし、これが成り立たない場合(条件付き平均がゼロまたは非ゼロの定数でない場合)、定数項を含めても問題は解決しません。この場合「吸収」するのは大きさですこれは、特定のサンプルとリグレッサの実現に依存します。実際には、一連の1に付けられた未知の係数は実際には定数ではなく変数であり、誤差項の非定数条件付き平均による回帰変数に依存します。

これは何を意味しますか? 単純化するために、iは観測にインデックスを付ける)がE u ix i= h x i)である最も単純なケースを想定します。つまり、エラー項は、同時期のもの(Xでは一連のものを含みません)を除いて、リグレッサから平均的に独立してます。E(uiXi)=0iE(uixi)=h(xi)X

定数項(一連の項の回帰変数)を含む回帰を指定すると仮定します。

y=a+Xβ+ε

および圧縮表記

y=Zγ+ε

ここ= 'Z = [ 1X ]γ = β'ε = U -a=(a,a,a...)Z=[1:X]γ=(a,β)ε=ua

その後、OLS推定量は

γ^=γ+(ZZ)1Zε

以下のための不偏我々の必要性。だがE[εZ]=0

E[εixi]=E[uiaxi]=h(xi)a

h x iが定数関数ではないケースを調べるため、すべてのに対してゼロにすることはできません。そうih(xi)

E[εZ]0E(γ^)γ

そして

もし私たちが回帰で定数項が含まれていても、その後、OLS推定器公平ではありません、つまり効率に関するガウス・マルコフの結果が失われることも意味しE(uixi)=h(xi)h(xj)=E(ujxj)ます。

さらに、誤差項 は、各iで異なる平均を持ち、分散も異なります(つまり、条件付きヘテロスケスティクスです)。そのため、リグレッサを条件とするその分布は、観測iで異なります。 εii

しかし、誤差項があっても、この手段通常想定されるが、その後、サンプリングエラーの分布γは - γは、通常されますがないゼロ平均mormal、および未知のバイアスが。そして、分散は異なります。そうuiγ^γ

場合、そして私たちは、回帰の定数項を含めた場合でも、仮説検定は、もはや有効ではありません。E(uixi)=h(xi)h(xj)=E(ujxj)

つまり、「有限サンプル」プロパティはすべてなくなりました。

漸近的に有効な推論に頼るオプションのみが残されているため、追加の仮定を行う必要があります。

簡単に言えば、厳密な外生性は「簡単に無視する」ことはできません


私はこれを完全に理解しているかどうかはわかりません。平均が同相性を仮定することと同等のリグレッサの関数ではないと仮定していませんか?
バットマン

@Batman私の投稿のどの部分に言及していますか?
アレコスパパドプロス

「回帰に定数項を含めると、この条件付き平均が既に定数であり、リグレッサの関数ではないと仮定した場合、誤差項のゼロ以外の条件付き平均を吸収します。これは重要な仮定です。定数項を含めるかどうかに関係なく作成する必要があります。」条件平均が回帰変数の関数ではないと仮定していないのは、ホモ分散性を仮定するときに正確に仮定していることですか?
バットマン

@Batman Homoskedasticityは、分散に関する仮定です。平均非依存性は、も定数であることを意味しないと仮定します。これは条件付きホモスケダスティクスにも必要です。実際、平均独立、E u x = c o n s t 条件付き不均一分散とともに、E u 2x = g x は標準モデルのバリアントです。E(uj2x)E(ux)=const.E(u2x)=g(x)
アレコスパパドプロス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.