この回答では、計量経済学の文献がランダム効果推定量と呼ぶものに関するGLSの観点に関するマシューの+1の回答について少し詳しく述べたいと思います。
GLSパースペクティブ
線形モデル
と
判断した場合、プールされたOLSによってモデルを単純に推定できますこれは、パネルデータ構造を無視し、すべての観測値をまとめて。
yit=α+Xitβ+uiti=1,…,m,t=1,…,T
E(uit|Xit)=0n=mT
エラーコンポーネントモデルを使用してをモデリングしますuit
uit=ηi+ϵit
行列表記では、モデルは、のように書くことができる
とあり一般的で-vectors要素および、およびはダミー変数の(ユニットごとに1列)の行列です。は、行がユニットに属する観測値に対応する場合、は列 1を持ち、それ以外の場合はます。
y=αιmT+Xβ+Dη+ϵ
yϵnyitϵitDn×mDiDii=1,…,m
さらに、
E(ϵϵ′)=σ2ϵI
個人固有の効果は独立している必要があります。ランダム効果推定器は、固定効果とは異なり(再び、計量経済学の用語)一方が、しかしながらさらに強い仮定が必要
プールこの仮定の下に、 OLSは不偏ですが、GLS推定量を導き出すことができます。が平均ゼロで分散 IIDであると仮定します。ηϵit
E(ηi|X)=0
ηiσ2η
この仮定はランダム効果という用語を説明します。さらに、2つのエラーコンポーネントが独立していると仮定すると、
Var(uit)Cov(uit,uis)Cov(uit,ujs)=σ2η+σ2ϵ=σ2η=0for all i≠j
次に、次の分散共分散行列取得します。
ここで、
と 1のベクトルです。我々はしたがって書き込むことができる
GLS推定について
必要です。このために、、n×nΩ
Ω=⎛⎝⎜⎜⎜⎜ΣO⋮OOΣ⋮O⋯⋯⋯OO⋮Σ⎞⎠⎟⎟⎟⎟
Σ=σ2ηιι′+σ2ϵIT
ιTΩ=σ2η(Im⊗ιι′)+σ2ϵ(Im⊗IT)
β^RE=(X′Ω−1X)−1X′Ω−1y
Ω−1JT=ιι′J¯T=JT/TET=IT−J¯T。その後、書き込み
または同じマトリックスとの用語を収集し、
のべき等およびは、
ここで。
Ω=Tσ2η(Im⊗J¯T)+σ2ϵ(Im⊗ET)+σ2ϵ(Im⊗J¯T)
Ω=(Tσ2η+σ2ϵ)(Im⊗J¯T)+σ2ϵ(Im⊗ET)
P=Im⊗J¯TQ=Im⊗ETΩ−1=1σ21P+1σ2ϵQ=−σ2ησ21σ2ϵ(Im⊗ιι′)+1σ2ϵ(Im⊗IT),
σ21=Tσ2η+σ2ϵ
ランダム効果推定量が有用である可能性がある理由、それは、もし多くのパネルデータアプリケーションでは非常に大きいプールOLSまたは固定効果与えられた仮定の下で(提供よりも効率的推定量であることとしてガウス・マルコフロジックは、次に、説明は、実際にと無相関です。要するに、GLSはこのモデルでは誤差共分散行列が等分散性ではないため、より効率的です。ηi
GLS推定値は、部分的に劣化したデータに対してOLSを実行することで取得できることを示すことができます:
ここで。場合、固定効果(「内」)推定量を取得します。一つが、「間」推定を取得します。GLS推定量は、2つの間の加重平均です。(場合、プールされたOLS推定量を取得します。)
(yit−θy¯i⋅)=(Xit−θX¯i⋅)β+(uit−θui⋅),
θ=1−ση/σ1θ=1θ→−∞θ=0
実現可能なGLS
FGLSアプローチを実用的にするには、および推定量が必要です。バルタギ、パネルデータの計量分析、p。16(第3版からの引用)では、続行方法に関する以下のオプションについて説明します。σ21σ2ϵ
最初にを観察すると仮定します。その後、uit
σ^21=T1m∑i=1mu¯2i⋅
および
はパラメーターの適切な推定量であり、はユニットの観測に対応する時間平均です。。
σ^2ϵ=1m(T−1)∑i=1m∑t=1T(uit−1m∑i=1mu¯i⋅)2
u¯i⋅i
ウォレスとフセイン(1969)のアプローチは、交換から成る(すべての後に、まだ存在の仮定の下で、公正かつ一貫性のある、)をプールOLS回帰の残差を有します。u
雨宮(1971)のアプローチは、FE(またはLSDV)の代わりに残差を使用して示唆しています。計算上の問題として、という制限を課してダミー変数トラップを回避し、を取得できるようにします。とは、LSDV残差と総平均を示します。∑iηi=0α^=y¯⋅⋅−X¯′⋅⋅β^FE⋅⋅itu^=y−α^−Xβ^FE
デフォルトのSwamy and Arora(1972)アプローチでは、
および
ここで、。
σ^2ϵ=[y′Q(I−X(X′QX)−1X′Q)y]/[m(T−1)−K]
σ^21=[y′P(I−Z(Z′PX)−1Z′P)y]/[m−K−1]
Z=(ιmTX)
Nerlove(1971)アプローチ推定からここでは固定効果回帰のダミーで、は、を分母とするこの回帰の残差平方和から推定されます。σ2η∑mi=1(η^i−η^¯)2/(m−1)η^iσ^2ϵmT
ランデルの計算が示すように、これらが大きな違いを生むことにも非常に驚きました!
編集:
違いについては、エラーコンポーネントの推定値がplm
パッケージ内で取得され、実際には非常に異なる結果が返され、ポイント推定値の違いを説明します(@Randelの回答によると、修正):βamemiya
> ercomp(stackY~stackX, data = paneldata, method = "walhus")
var std.dev share
idiosyncratic 21.0726 4.5905 0.981
individual 0.4071 0.6380 0.019
theta: 0.06933
> ercomp(stackY~stackX, data = paneldata, method = "swar")
var std.dev share
idiosyncratic 0.6437 0.8023 0.229
individual 2.1732 1.4742 0.771
theta: 0.811
> ercomp(stackY~stackX, data = paneldata, method = "nerlove")
var std.dev share
idiosyncratic 0.5565 0.7460 0.002
individual 342.2514 18.5000 0.998
theta: 0.9857
個々の効果とが相関するデータを使用してFEとREの違いを示すことを目的とする姉妹スレッドの例では、エラーコンポーネントの推定値も一貫していないと思われます。(実際、REはFEの加重平均であるという事実と、誤差成分の推定値によって決定される重みを持つ推定値との間で、最終的にRE推定値をFE推定値から遠ざけるため、そうすることはできません。一貫性があり、最終的にはこれらの推定によるものでなければなりません。)X
その例の「問題のある」機能を置き換えると、
alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))
単純に言うと、
alpha = runif(n)
と相関のない変量効果により、誤差成分を推定するすべてのバリアントについて、真の値に非常に近い REポイント推定値が得られます。Xββ=−1
参照資料
雨宮T、1971、分散成分モデルにおける分散の推定、国際経済レビュー 12、1–13。
Baltagi、BH、パネルデータの計量分析、Wiley。
Nerlove、M.、1971a、断面の時系列からの動的経済関係の推定に関するさらなる証拠、Econometrica 39、359-382。
Swamy、PAVBおよびSS Arora、1972年、誤差成分回帰モデルの係数の推定量の正確な有限サンプルプロパティ、Econometrica 40、261–275。
Wallace、TD and A. Hussain、1969、The use of error components models in cross-section and time-series data、Econometrica 37、55–72。