計量経済学の「変量効果モデル」は、計量経済学以外の混合モデルとどの程度正確に関係していますか?


56

計量経済学の「ランダム効果モデル」は、計量経済学の外の「ランダムな切片を持つ混合モデル」に対応すると考えていましたが、今はわかりません。しますか?

計量経済学では、「固定効果」や「ランダム効果」などの用語を混合モデルに関する文献とは多少異なる方法で使用しているため、悪名高い混乱が生じています。私たちは、単純な状況について考えてみましょう直線的に依存してが、測定値の異なるグループで異なる切片での:xyx

yit=βxit+ui+ϵit.

ここで、各ユニット/グループは異なる時点観測されます。計量経済学者はそれを「パネルデータ」と呼びます。トンit

  • 混合モデルの用語では、を固定効果またはランダム効果(この場合はランダムインターセプト)として扱うことができます。固定として扱うことは、とをフィッティングして、平方誤差を最小化することを意味します(つまり、ダミーグループ変数を使用してOLS回帰を実行する)。それを我々はさらにその仮定として、ランダムな手段治療と合わせて最大尤度を使用しとの代わりに、各フィッティング独自にします。これは、推定値が平均値向かって縮小する「部分プーリング」効果にます。β uと I uのINU 0σ 2 UU 0 σ 2 U U I 、U I 、U 0uiβ^u^iuiN(u0,σu2)u0σu2uiu^iu^0

    R formula when treating group as fixed:    y ~ x + group
    R formula when treating group as random:   y ~ x + (1|group)
    
  • 計量経済学の用語では、このモデル全体を固定効果モデルまたはランダム効果モデルとして扱うことができます。最初のオプションは、上記の固定効果と同等です(ただし、計量経済学には、この場合を推定する独自の方法があります)。以前は、2番目のオプションは上記のランダム効果と同等であると考えていました。例:@JiebiaoWangは、ランダム効果、固定効果、限界モデルの違いは何ですか?と言う β"within" estimator

    計量経済学では、ランダム効果モデルは、生物統計学のようにランダム切片モデルのみを参照する場合があります

さて、この理解が正しいかどうかテストしてみましょう。@ChristophHanck が固定効果、ランダム効果、混合効果モデルの違いは何ですか?(Rを使用しない人のためにデータをpastebinここに配置します):

ここに画像の説明を入力してください

@Christophは、計量経済学アプローチを使用して2つの適合を行います。

fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")

最初のものはに等しいベータの推定値を生成し-1.0451、2番目のものは0.77031(はい、正!)私はそれを再現しようlmとしましたlmer

l1 = lm(stackY ~ stackX + as.factor(unit), data = paneldata)
l2 = lmer(stackY ~ stackX + (1|as.factor(unit)), data = paneldata)

最初のものは-1.045、上記の推定量と完全に一致します。クール。しかし、2番目は-1.026、ランダム効果推定量から数マイル離れたをもたらします。へえ?何が起こっている?実際、と呼ばれたとき、何をし plmmodel = "random"ますか?

それが何をしていても、混合モデルの観点からどうにか理解できますか?

そして、それがしていることの背後にある直感は何ですか?いくつかの計量経済学の場所で、変量効果推定量は固定効果推定量と"between" estimator、モデルにグループアイデンティティをまったく含めない場合、多かれ少なかれ回帰勾配の間の加重平均であると読みました(この推定値は、例えば、4@ Andy は次のように書いています

ランダム効果推定器は、データの変動内および変動間のマトリックス加重平均を使用します。[...]これにより、ランダム効果がより効率的になります[。]

どうして?なぜこの加重平均が必要なのでしょうか?特に、混合モデルを実行するのではなくなぜそれが必要なのでしょうか?


8
うわー、20時間以上の賛成票と6つの啓発的な答えが24時間以内にありますが、それらはすべて思考の計量経済的側面に焦点を当てています。これまでのところ、混合モデルとの関連はありません。
アメーバは、モニカの復活を


回答:


16

要約:計量経済学の「変量効果モデル」と「変量切片混合モデル」は実際には同じモデルですが、推定方法は異なります。計量経済学ではFGLSを使用し、混合モデルではMLを使用します。FGLSを実行するさまざまなアルゴリズムがあり、それらの一部(このデータセット上)は、MLに非常に近い結果を生成します。


1.の推定方法の違い plm

@ChristophHanckによって生成されたデータを使用して、plm(..., model = "random")lmer()でテストして回答します。

plmパッケージマニュアルによると、次の 4つのオプションがありますrandom.method:ランダム効果モデルの分散成分の推定方法。@amoebaはデフォルトのものを使用しましたswar(Swamy and Arora、1972)。

ランダム効果モデルの場合、random.methodを「swar」(Swamy and Arora(1972))(デフォルト)、「amemiya」(Amemiya(1971))、「walhus」( Wallace and Hussain(1969))、または「nerlove」(Nerlove(1971))。

同じデータを使用して4つのオプションすべてをテストし、のエラーとamemiya、変数の3つのまったく異なる係数推定値を取得しましたstackX。using random.method='nerlove'および 'amemiya'のものはlmer()、-1.029および-1.025対-1.026のものとほぼ同等です。また、「固定効果」モデル-1.045で得られたものと大差ありません。

# "amemiya" only works using the most recent version:
# install.packages("plm", repos="http://R-Forge.R-project.org")

re0 <- plm(stackY~stackX, data = paneldata, model = "random") #random.method='swar'
re1 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='amemiya')
re2 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='walhus')
re3 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='nerlove')
l2  <- lmer(stackY~stackX+(1|as.factor(unit)), data = paneldata)

coef(re0)     #    (Intercept)   stackX    18.3458553   0.7703073 
coef(re1)     #    (Intercept)   stackX    30.217721   -1.025186 
coef(re2)     #    (Intercept)   stackX    -1.15584     3.71973 
coef(re3)     #    (Intercept)   stackX    30.243678   -1.029111 
fixef(l2)     #    (Intercept)   stackX    30.226295   -1.026482 

残念ながら、現時点では時間がありませんが、興味のある読者は推定手順を確認するために4つのリファレンスを見つけることができます。それらがなぜそのような違いをもたらすのかを理解することは非常に役立つでしょう。場合によっては、on変換されたデータplmを使用した推定手順は、lm()で使用される最尤法と同等であると予想されlmer()ます。

2. GLSとMLの比較

plmパッケージの作成者は、論文のセクション7の2つを比較しました:Yves CroissantとGiovanni Millo、2008年、Panel Data Econometrics in R:The plm package

計量経済学は主に非実験データを扱います。仕様手順と仕様ミスのテストに重点が置かれています。したがって、モデルの仕様は非常に単純になる傾向がありますが、リグレッサーの内生性、エラーの依存構造、および正規性からの逸脱下での推定量のロバスト性に大きな注意が払われます。推奨されるアプローチは、多くの場合、セミパラメトリックまたはノンパラメトリックであり、推定とテストの両方で、不均一分散技術が標準的な手法になりつつあります。

これらすべての理由により、計量経済学におけるパネルモデルの推定は、主にエイトケンの定理に基づく一般化最小二乗フレームワークで達成されます[...]。逆に、縦方向のデータ・モデルにnlme及びlme4(制限または無制限)最大尤度により推定されます。[...]

計量経済学のGLSアプローチには、標準線形代数で計算可能な閉形式の分析解があり、後者はときどき計算機上で計算量が多くなることがありますが、推定量の表現は通常かなり単純です。反対に、縦モデルのML推定は、閉形式の解のない非線形関数の数値最適化に基づいているため、近似と収束基準に依存しています。


3.混合モデルの更新

@ChristophHanckがrandom.method使用されている4つの詳細なplm説明を提供し、それらの推定値が非常に異なる理由を説明してくれたことに感謝します。@amoebaの要求に応じて、混合モデル(尤度ベース)とGLSとの接続についていくつかの考えを追加します。

尤度ベースの方法は通常、変量効果と誤差項の両方の分布を想定しています。正規分布の仮定が一般的に使用されますが、非正規分布を仮定する研究もいくつかあります。ランダムインターセプトモデルの@ChristophHanckの表記法に従い、不均衡なデータ、つまり許可します。T=ni

モデルは と。

yit=xitβ+ηi+ϵiti=1,,m,t=1,,ni
ηiN(0,ση2),ϵitN(0,σϵ2)

各について、 したがって、対数尤度関数はi

yiN(Xiβ,Σi),Σi=ση21ni1ni+σϵ2Ini.
const12ilog|Σi|12i(yiXiβ)Σi1(yiXiβ).

Laird and Ware(1982)に示されているように、すべての分散がわかっている場合、MLEは GLSと同等 @ChristophHanckから派生。そのため、重要な違いは分散の推定にあります。閉じた形式のソリューションがないことを考えると、いくつかのアプローチがあります。

β^=(iXiΣi1Xi)1(iXiΣi1yi),
β^RE
  • 最適化アルゴリズムを使用した対数尤度関数の直接最大化。
  • 期待値最大化(EM)アルゴリズム:閉形式の解は存在しますが、推定量にはランダム切片の経験的ベイズ推定が含まれます。β
  • 上記の2つの組み合わせ、Expectation / Conditional Maximization Both(ECME)アルゴリズム(Schafer、1998; R package lmm)。異なるパラメーター化により、(上記)およびが存在します。の解は、ここではとして定義され、EMフレームワークで推定できます。βσϵ2σϵ2
    σϵ2=1inii(yiXiβ^)(ξ^1ni1ni+Ini)1(yiXiβ^),
    ξση2/σϵ2

要約すると、MLEには分布の仮定があり、反復アルゴリズムで推定されます。MLEとGLSの主な違いは、分散の推定にあります。

クロワッサンとミロ(2008)は、

正規性の下では、等分散性と誤差の連続相関なしOLSも最尤推定量であり、他のすべての場合には重要な違いがあります。

私の意見では、分布の仮定については、パラメトリックアプローチとノンパラメトリックアプローチの違いと同様に、仮定が成立するとMLEがより効率的になり、GLSがより堅牢になります。


エラーメッセージの問題は、変数をベクトルとして生成することに何らかの関係があると思われますか?たぶん、plmはデータを別の方法で保存することを好みますか?
クリストフハンク

1
nerloveここではうまく機能しますが、最後のパネルから1つの観測値を削除し、すべてのメソッドを実行しようとしたことがわかったため、アンバランスパネルには実装されていません。
アメーバは、モニカを

2
@ChristophHanck @amoebaのplmエラーは、モデルに共変量が1つしかない場合のマトリックス形式を保持random.method="amemiya"するX[, -1, drop=FALSE]代わりにおそらく使用すべきであるというエラーです。とにかく、標準の標準変数を式に追加することで、これを克服しようとしました。-1.02の推定値で結果を再現し、不均衡なデータでも機能します。X[, -1]X[, -1]amemiya
ランデル

3
@ jiebiao王@ChristophHanckは、PLMの現在の開発版がで正常に動作@amoeba random.method="amemiya":VAR std.devシェア特有0.6360 0.7975 0.002個々 313.6510 17.7102 0.998シータ:0.9841
Helix123

1
こんにちは@JiebiaoWang。更新後、あなたの答えは私の質問に十分に答えていると思いました。私は自由にいくつかの編集をamemiya行い、ML vs GLS についての更新と引用を挿入しました。私はそれを受け入れられたものとしてマークし、賞金を授与するつもりです。乾杯。
アメーバは、モニカを復活させる

17

この答えは混合モデルについてはコメントしていませんが、変量効果推定器が何をするのか、そしてなぜそれがそのグラフで台無しになるのかを説明できます。

要約:変量効果推定器は想定していますが、この例ではそうではありません。E[uix]=0


ランダム効果推定器は何をしていますか?

モデルがあると仮定します。

yit=βxit+ui+ϵit

変動の2つの次元、グループと時間ます。を見積もるには:itβ

  1. グループ内の時系列変化のみを使用します。これは、固定効果推定器が行うことです(そして、これがしばしば内部推定器とも呼ばれる理由です)。
  2. がランダムである場合、グループの時系列平均間の断面変動のみを使用できます。これは推定値として知られています。ui

    具体的には、各グループについて、上記のパネルデータモデルの経時的な平均を取得します。i

    y¯i=βx¯i+vi where vi=ui+ϵ¯i

    この回帰を実行すると、between推定量が得られます。効果がと相関のないランダムなホワイトノイズである場合、それは一貫した推定量であることにてください!これが当てはまる場合、グループ間の変動を完全に投げることは(固定効果推定器で行うように)非効率的です。uix

計量経済学の変量効果推定器は、(1)推定器内(すなわち固定効果推定器)と(2)推定器間を組み合わせて、効率を最大化します。これは一般化最小二乗法の適用であり、基本的な考え方は逆分散重み付けです。効率を最大化するため、変量効果推定器はを推定器内および推定器間の重み付き平均として計算します。β^

そのグラフで何が起こっているのか...

そのグラフを見るだけで、何が起こっているかをはっきりと確認できます。

  • 各グループ(つまり、同じ色のドット)内で、高いは低い関連付けられixityit
  • より高い持つグループは、より高い持ちます。ix¯iui

という変量効果の仮定は明らかに満たされていない。グループ効果は(統計的な意味で)直交していません。むしろ、グループ効果はと明確な正の関係を持っています。E[uix]=0uixx

between推定器は想定してい。between推定量は、「正にすることで、を課すことができることを確認する!E[uix]=0E[uix]=0β^

次に、ランダム効果推定器は、推定器内および推定器間の加重平均であるためオフになります。


+1、マシューに感謝します。誰かがあなたの答えを断った理由がわかりません。混合モデルへの接続を確立するための回答を探しているので、私はあなたのものを受け入れませんが、この議論にはまだ役立ちます。ここでGLSと逆分散の重み付けがどのように適用され、計算されるかについて少し拡張できれば、非常に便利です。
アメーバは、モニカーを復活させる

16

この回答では、計量経済学の文献がランダム効果推定量と呼ぶものに関するGLSの観点に関するマシューの+1の回答について少し詳しく述べたいと思います。

GLSパースペクティブ

線形モデル と 判断した場合、プールされたOLSによってモデルを単純に推定できますこれは、パネルデータ構造を無視し、すべての観測値をまとめて。

yit=α+Xitβ+uiti=1,,m,t=1,,T
E(uit|Xit)=0n=mT

エラーコンポーネントモデルを使用してをモデリングしますuit

uit=ηi+ϵit

行列表記では、モデルは、のように書くことができる とあり一般的で-vectors要素および、およびはダミー変数の(ユニットごとに1列)の行列です。は、行がユニットに属する観測値に対応する場合、は列 1を持ち、それ以外の場合はます。

y=αιmT+Xβ+Dη+ϵ
yϵnyitϵitDn×mDiDii=1,,m

さらに、

E(ϵϵ)=σϵ2I

個人固有の効果は独立している必要があります。ランダム効果推定器は、固定効果とは異なり(再び、計量経済学の用語)一方が、しかしながらさらに強い仮定が必要 プールこの仮定の下に、 OLSは不偏ですが、GLS推定量を導き出すことができます。が平均ゼロで分散 IIDであると仮定します。ηϵit

E(ηi|X)=0
ηiση2

この仮定はランダム効果という用語を説明します。さらに、2つのエラーコンポーネントが独立していると仮定すると、

Var(uit)=ση2+σϵ2Cov(uit,uis)=ση2Cov(uit,ujs)=0for all ij

次に、次の分散共分散行列取得します。 ここで、 と 1のベクトルです。我々はしたがって書き込むことができる GLS推定について 必要です。このために、、n×nΩ

Ω=(ΣOOOΣOOOΣ)
Σ=ση2ιι+σϵ2IT
ιT
Ω=ση2(Imιι)+σϵ2(ImIT)
β^RE=(XΩ1X)1XΩ1y
Ω1JT=ιιJ¯T=JT/TET=ITJ¯T。その後、書き込み または同じマトリックスとの用語を収集し、 のべき等およびは、 ここで。
Ω=Tση2(ImJ¯T)+σϵ2(ImET)+σϵ2(ImJ¯T)
Ω=(Tση2+σϵ2)(ImJ¯T)+σϵ2(ImET)
P=ImJ¯TQ=ImET
Ω1=1σ12P+1σϵ2Q=ση2σ12σϵ2(Imιι)+1σϵ2(ImIT),
σ12=Tση2+σϵ2

ランダム効果推定量が有用である可能性がある理由、それは、もし多くのパネルデータアプリケーションでは非常に大きいプールOLSまたは固定効果与えられた仮定の下で(提供よりも効率的推定量であることとしてガウス・マルコフロジックは、次に、説明は、実際にと無相関です。要するに、GLSはこのモデルでは誤差共分散行列が等分散性ではないため、より効率的です。ηi

GLS推定値は、部分的に劣化したデータに対してOLSを実行することで取得できることを示すことができます: ここで。場合、固定効果(「内」)推定量を取得します。一つが、「間」推定を取得します。GLS推定量は、2つの間の加重平均です。(場合、プールされたOLS推定量を取得します。)

(yitθy¯i)=(XitθX¯i)β+(uitθui),
θ=1ση/σ1θ=1θθ=0

実現可能なGLS

FGLSアプローチを実用的にするには、および推定量が必要です。バルタギ、パネルデータの計量分析、p。16(第3版からの引用)では、続行方法に関する以下のオプションについて説明します。σ12σϵ2

最初にを観察すると仮定します。その後、uit

σ^12=T1mi=1mu¯i2
および はパラメーターの適切な推定量であり、はユニットの観測に対応する時間平均です。。
σ^ϵ2=1m(T1)i=1mt=1T(uit1mi=1mu¯i)2
u¯ii

ウォレスとフセイン(1969)のアプローチは、交換から成る(すべての後に、まだ存在の仮定の下で、公正かつ一貫性のある、)をプールOLS回帰の残差を有します。u

雨宮(1971)のアプローチは、FE(またはLSDV)の代わりに残差を使用して示唆しています。計算上の問題として、という制限を課してダミー変数トラップを回避し、を取得できるようにします。とは、LSDV残差と総平均を示します。iηi=0α^=y¯X¯β^FEitu^=yα^Xβ^FE

デフォルトのSwamy and Arora(1972)アプローチでは、 および ここで、。

σ^ϵ2=[yQ(IX(XQX)1XQ)y]/[m(T1)K]
σ^12=[yP(IZ(ZPX)1ZP)y]/[mK1]
Z=(ιmTX)

Nerlove(1971)アプローチ推定からここでは固定効果回帰のダミーで、は、を分母とするこの回帰の残差平方和から推定されます。ση2i=1m(η^iη^¯)2/(m1)η^iσ^ϵ2mT

ランデルの計算が示すように、これらが大きな違いを生むことにも非常に驚きました!

編集:

違いについては、エラーコンポーネントの推定値がplmパッケージ内で取得され、実際には非常に異なる結果が返され、ポイント推定値の違いを説明します(@Randelの回答によると、修正):βamemiya

> ercomp(stackY~stackX, data = paneldata, method = "walhus")
                  var std.dev share
idiosyncratic 21.0726  4.5905 0.981
individual     0.4071  0.6380 0.019
theta:  0.06933  
> ercomp(stackY~stackX, data = paneldata, method = "swar")
                 var std.dev share
idiosyncratic 0.6437  0.8023 0.229
individual    2.1732  1.4742 0.771
theta:  0.811  
> ercomp(stackY~stackX, data = paneldata, method = "nerlove")
                   var  std.dev share
idiosyncratic   0.5565   0.7460 0.002
individual    342.2514  18.5000 0.998
theta:  0.9857  

個々の効果とが相関するデータを使用してFEとREの違いを示すことを目的とする姉妹スレッドの例では、エラーコンポーネントの推定値も一貫していないと思われます。(実際、REはFEの加重平均であるという事実と、誤差成分の推定値によって決定される重みを持つ推定値との間で、最終的にRE推定値をFE推定値から遠ざけるため、そうすることはできません。一貫性があり、最終的にはこれらの推定によるものでなければなりません。)X

その例の「問題のある」機能を置き換えると、

alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))

単純に言うと、

alpha = runif(n)

と相関のない変量効果により、誤差成分を推定するすべてのバリアントについて、真の値に非常に近い REポイント推定値が得られます。Xββ=1


参照資料

雨宮T、1971、分散成分モデルにおける分散の推定国際経済レビュー 12、1–13。

Baltagi、BH、パネルデータの計量分析、Wiley。

Nerlove、M.、1971a、断面の時系列からの動的経済関係の推定に関するさらなる証拠Econometrica 39、359-382。

Swamy、PAVBおよびSS Arora、1972年、誤差成分回帰モデルの係数の推定量の正確な有限サンプルプロパティEconometrica 40、261–275。

Wallace、TD and A. Hussain、1969、The use of error components models in cross-section and time-series dataEconometrica 37、55–72。


4
+1。クリストフに感謝します。これは役に立ちました。このスレッドで数学的な詳細を最後に見ることができてうれしいです。plmRandelで実装およびリストされている4つのメソッドがどのように機能するかを調べて、それに関するコメントを追加して回答を更新するとよいでしょう。詳細な説明でない場合は、少なくとも何が起こっているかについての簡単なメモ。あなたはそれを調べることができると思いますか?私はそのための賞金を提供できることを嬉しく思います:-)私の素朴なアプローチは、固定効果ソリューションから両方のシグマを推定することです。「名前付き」メソッドの1つに対応していますか?
アメーバは、モニカーを復活させる

@amoeba、私は誤差成分モデルの分散を推定する方法についてのコメントを含めました。あなたの提案は、雨宮の提案と密接に関連しているように見えます。
クリストフハンク

とても素敵です、ありがとう。Nerloveもダミーの回帰を使用していませんか?実際、雨宮とネルロベの違いはよくわかりません。私の「素朴な」提案は、ダミー回帰に適合し、残差分散を推定値として使用し、ダミー係数の分散を推定値として使用することでした。それがNerloveがやっていることのように見えます。雨宮が何をしていて、どのように違うのか理解していない。(そして、私はこれらの方法がこの場合にそのような違いを生む理由についての大きなやり過ぎの質問が残っていることに同意します。)σϵση
アメーバは

はい、両方ともダミーで回帰を使用します。私の知る限り、雨宮とネルラブの違いの1つは、自由度補正の分母です。もう1つは、推定されたダミー係数の分散が残差の分散と同じかどうかわからないということです。もう1つの重要なものは、Nerloveが直接を推定することを目的としているのに対し、他の3つについてはを介して推定をバックアウトする必要があることです。、これらの既知の欠点の1つは、これらが非負であるという保証がないことです。ση2(σ^12σ^ϵ2)/T
クリストフハンク

1
ありがとう。より明示的な式を提供するために編集を行いましたが、再確認することもできます(ただし、正しいと思います)。私はあなたの答えに賞を贈るという賞金を始めました。しかし、私はまだ混合モデルへのつながりを描き、GLSとMLEを対比し、どのアプローチを好むのかを説明する答えを探しています(現在の答えはどれもしないので、現在答えはありません) 「承認済み」としてチェックします)。MLE(によって実装されている)がNerloveの分散推定値に非常に近い分散推定値を生成するのは興味深いことです。Ω1lmer
アメーバは、モニカーを復活させる

11

私はあなたのコードにコメントするほどRに精通していませんが、単純なランダムインターセプト混合モデルはRE MLE推定器と同一であり、合計が小さい場合を除いてRE GLS推定器に非常に近いですデータは不均衡です。うまくいけば、これは問題の診断に役立つでしょう。もちろん、これはすべてRE推定量が適切であると仮定しています。N=iTi

同等性を示すいくつかのStataがesttabあります(必須およびeststoSSCから):

set more off
estimates clear
webuse nlswork, clear
eststo, title(mixed): mixed ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure || id: // Mixed estimator
eststo, title(MLE): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) mle // MLE RE estimator 
eststo, title(GLS): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) re // GLS RE estimato
esttab *, b(a5) se(a5) mtitle 

最後の行の出力は次のとおりです。

. esttab *, b(a5) se(a5) mtitle 

------------------------------------------------------------
                      (1)             (2)             (3)   
                    mixed             MLE             GLS   
------------------------------------------------------------
main                                                        
grade            0.070790***     0.070790***     0.070760***
              (0.0017957)     (0.0017957)     (0.0018336)   

age              0.031844***     0.031844***     0.031906***
              (0.0027201)     (0.0027202)     (0.0027146)   

c.age#c.age   -0.00065130***  -0.00065130***  -0.00065295***
             (0.000044965)    (0.000044971)    (0.000044880)   

ttl_exp          0.035228***     0.035228***     0.035334***
              (0.0011382)     (0.0011392)     (0.0011446)   

tenure           0.037134***     0.037134***     0.037019***
              (0.0015715)     (0.0015723)     (0.0015681)   

c.tenure#c~e   -0.0018382***   -0.0018382***   -0.0018387***
             (0.00010128)    (0.00010128)    (0.00010108)   

_cons             0.14721***      0.14721***      0.14691** 
               (0.044725)      (0.044725)      (0.044928)   
------------------------------------------------------------
lns1_1_1                                                    
_cons            -1.31847***                                
               (0.013546)                                   
------------------------------------------------------------
lnsig_e                                                     
_cons            -1.23024***                                
              (0.0046256)                                   
------------------------------------------------------------
sigma_u                                                     
_cons                             0.26754***                
                              (0.0036240)                   
------------------------------------------------------------
sigma_e                                                     
_cons                             0.29222***                
                              (0.0013517)                   
------------------------------------------------------------
N                   28099           28099           28099   
------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

データでは、グループ効果は明ら​​かにxと相関しているため、RE推定量を使用するための仮定は満たされず、非常に異なる推定値が得られます。GLS RE推定器は、実際には推定器間および推定器内の行列加重平均である一般化モーメント法(GMM)推定器です。範囲内の推定器はここで問題ありませんが、Xの大きなプラスの効果を示すため、その間の差は深くねじ込まれます。したがって、GLSはほとんどが推定器の間です。MLE REは、変量効果モデルの尤度を最大化するMLEです。同じ答えを出すことはもはや期待されていません。ここで、混合推定器はFE "Within"推定器に非常に近いものを与えています。

. esttab *, b(a5) se(a5) mtitle 

----------------------------------------------------------------------------
                      (1)             (2)             (3)             (4)   
                    mixed             GLS             MLE          Within   
----------------------------------------------------------------------------
main                                                                        
x                -1.02502***      0.77031**       3.37983***     -1.04507***
               (0.092425)       (0.26346)       (0.20635)      (0.093136)   

_cons             30.2166***      18.3459***      0.49507         30.3492***
                (5.12978)       (2.31566)             (.)       (0.62124)   
----------------------------------------------------------------------------
lns1_1_1                                                                    
_cons             2.87024***                                                
                (0.20498)                                                   
----------------------------------------------------------------------------
lnsig_e                                                                     
_cons            -0.22598**                                                 
               (0.077195)                                                   
----------------------------------------------------------------------------
sigma_u                                                                     
_cons                                             2.40363                   
                                                (1.28929)                   
----------------------------------------------------------------------------
sigma_e                                                                     
_cons                                             4.23472***                
                                                (0.37819)                   
----------------------------------------------------------------------------
N                      96              96              96              96   
----------------------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

上記の表のStataコードは次のとおりです。

clear
set more off
estimates clear

input int(obs id t) double(y x)
1      1           1  2.669271  0.5866982
2      1           2  1.475540  1.3500454
3      1           3  4.430008  0.6830919
4      1           4  2.162789  0.5845966
5      1           5  2.678108  1.0038879
6      1           6  3.456636  0.5863289
7      1           7  1.769204  2.3375403
8      1           8  3.413790  0.9640034
9      2           1  4.017493  1.5084121
10     2           2  4.218733  2.8982499
11     2           3  4.509530  3.2141335
12     2           4  6.106228  2.0317799
13     2           5  5.161379  2.1231733
14     2           6  2.724643  4.3369017
15     2           7  4.500306  1.9141065
16     2           8  4.119322  2.8667938
17     3           1  9.987779  2.3961969
18     3           2  7.768579  3.5509275
19     3           3  9.379788  3.3284869
20     3           4 10.035937  2.2997389
21     3           5 11.752360  2.8143474
22     3           6  9.500264  2.1825704
23     3           7  8.921687  5.0126462
24     3           8  8.269932  3.4046339
25     4           1 12.101253  3.2928033
26     4           2 11.482337  3.1645218
27     4           3 10.648010  4.8073987
28     4           4  9.687320  5.3394193
29     4           5 12.796925  3.1197431
30     4           6  9.971434  4.6512983
31     4           7 10.239717  4.7709378
32     4           8 12.245207  2.7952426
33     5           1 18.473320  5.8421967
34     5           2 19.097212  4.9425391
35     5           3 19.460495  4.9166172
36     5           4 18.642305  4.9856035
37     5           5 17.723912  5.0594425
38     5           6 16.783248  4.8615618
39     5           7 16.100984  6.2069167
40     5           8 18.851351  3.8856152
41     6           1 19.683171  7.5568816
42     6           2 21.104231  6.7441900
43     6           3 22.115529  6.4486514
44     6           4 22.061362  5.3727434
45     6           5 22.457905  5.8665798
46     6           6 21.424413  6.0578997
47     6           7 23.475946  4.4024323
48     6           8 24.884950  4.1596914
49     7           1 25.809011  7.6756255
50     7           2 25.432828  7.7910756
51     7           3 26.790387  7.3858301
52     7           4 24.640850  8.2090606
53     7           5 26.050086  7.3779219
54     7           6 25.297148  6.8098617
55     7           7 26.551229  7.6694272
56     7           8 26.669760  6.4425772
57     8           1 26.409669  8.3040894
58     8           2 26.570003  8.4686087
59     8           3 29.018818  7.2476785
60     8           4 30.342613  4.5207729
61     8           5 26.819959  8.7935557
62     8           6 27.147711  8.3141224
63     8           7 26.168568  9.0148308
64     8           8 27.653552  8.2081808
65     9           1 34.120485  7.8415520
66     9           2 31.286463  9.7234259
67     9           3 35.763403  6.9202442
68     9           4 31.974599  9.0078286
69     9           5 32.273719  9.4954288
70     9           6 29.666208 10.2525763
71     9           7 30.949857  9.4751679
72     9           8 33.485967  8.1824810
73    10           1 36.183128 10.7891587
74    10           2 37.706116  9.7119548
75    10           3 38.582725  8.6388290
76    10           4 35.876781 10.8259279
77    10           5 37.111179  9.9805046
78    10           6 40.313149  7.7487456
79    10           7 38.606329 10.2891107
80    10           8 37.041938 10.3568765
81    11           1 42.617586 12.1619185
82    11           2 41.787495 11.1420338
83    11           3 43.944968 11.1898730
84    11           4 43.446467 10.8099599
85    11           5 43.420819 11.2696770
86    11           6 42.367318 11.6183869
87    11           7 43.543785 11.1336555
88    11           8 43.750271 12.0311065
89    12           1 46.122429 12.3528733
90    12           2 47.604306 11.4522787
91    12           3 45.568748 13.6906476
92    12           4 48.331177 12.3561907
93    12           5 47.143246 11.7339915
94    12           6 44.461190 13.3898768
95    12           7 46.879044 11.4054972
96    12           8 46.314055 12.3143487
end

eststo, title(mixed): mixed y x || id:, mle // Mixed estimator
eststo, title(GLS): xtreg y x, i(id) re     // GLS RE estimato
eststo, title(MLE): xtreg y x, i(id) mle    // MLE RE estimator 
eststo, title(Within): xtreg y x, i(id) fe  // FE Within estimator 
eststo, title(Between): xtreg y x, i(id) be // Between estimator 

esttab *, b(a5) se(a5) mtitle 

+1。Dimitriyに感謝します。同じおもちゃのデータセットでStataの出力を見ると間違いなく役立ちます。MLE推定量について質問があります。混合モデルのアプローチ(mixedStataおよびlmerR)も最尤法または「制限付き最尤法」であると考えました(どちらかをlmer設定することで呼び出しで使用でき、REML=TまたはREML=Fほぼ同じ結果が得られます)。しかし、混合モデルのアプローチは非常に賢明で正しい結果をもたらしますが、Statが「MLE」と呼ぶものはこの場合ナンセンスな結果をもたらします。違いはなんですか?Statの「MLE」とは正確には何を指しますか?
アメーバは、モニカを

2
@amoeba両方mixed, mlextreg, mleはMLE推定量ですが、尤度関数は多少異なります。前者についてはこちらを、後者についてはこちらをご覧ください。モデルが非常に堅牢である理由はよくわかりません。mixed
ディミトリV. Masterov

xtmixedは、古いバージョンのStataでmixedと呼ばれていたものです。あなたのデータについては、マニュアルが示唆しているように、その等価性は明らかに保持されませんが、私のデータには保持されます。
Dimitriy V. Masterov

ssc install estout私の回想では、バージョンによって機能が異なり、下位互換性がありませんでした。
StasK

1
@StasKは私にStataの技術サポートと連絡を取り、彼らはそれがおそらくバグだと言ったxtreg, mle「一般的に、結果は同じはずです[...]。これらの種類の違いは、通常、モデルのパラメーターの推定に識別問題がある場合に発生します。[...]実際に分散の条件番号を確認しました-xtreg、mle-、および-mixed、mle-では4000以上の両方の計算とその数から得られる-共分散行列。[...]開発者[...]は問題を評価して、固定コードが必要です。」
アメーバは、モニカーを復活させる

9

さらに混乱させてください:

計量経済学-固定効果が接近
パネルデータの計量経済学の「固定効果」アプローチを、個々の効果変数の存在「通過によって」によって、勾配係数(ベータ)を推定する方法である、等によるものそれが「固定」または「ランダム」であるかどうかについての仮定を行います。これは、「最初の差」推定器(データの最初の差を使用)と「内」推定器(時間平均からの偏差を使用)が行うことです。ベータのみを推定します。αi

個々の効果(「切片」)を明示的に定数として扱うより伝統的なアプローチでは、最小二乗ダミー変数(LSDV)推定量を使用します。これは、の注の推定も提供します。3つの推定量は、ベータに対して生成された推定に関して代数的に一致しますが、線形モデルのみです。αi

ディスカッション(クラスのメモから一部抜粋)

「固定効果アプローチの主な利点は、個々の効果の性質について仮定をする必要がないことです。このような相関関係の存在を無視し、プールされたモデルにOLSを単純に適用すると、一貫性のない推定値が生成されます。不変のリグレッサーは、これらの変数が観測不可能な個々の効果とともに差異化されるため、推定できません。個々の効果(LSDV推定器を使用する場合)を一貫して推定することはできません(時間ディメンションを無限にした場合を除く)。

計量経済学-ランダム効果APPROACH
「伝統的な」計量経済学ランダム効果的なアプローチでは、我々は、個々の「インターセプト」ことを前提とし「通常」のエラー用語は「一時的」誤差成分であるが、「永久にランダムコンポーネント」です。αi

興味深い拡張では、追加のランダム性は、固定(一定)個別効果と誤差項に加えて、時間変化以外のすべての断面に共通するランダム時間効果の存在から発生します。この「時間効果」は、たとえば、経済全体のレベルでのすべての世帯に等しく影響する総合的なショックを表しています。このような総体的な外乱は実際に観察されているため、現実的なモデリングの選択肢のようです。

ここで、「ランダム効果」推定量は、効率を高めるための一般化最小二乗(GLS)推定量です。

ここで、もう1つの考えられた推定器である「Between」推定器が、時間平均観測値に対してOLSを実行します。代数の問題として、GLS推定量は、WithinおよびBetween推定量の加重平均として取得できることが示されています。ここで、重みは任意ではなく、2つのVCV行列に関連しています。

...また、「無相関ランダム効果」および「相関ランダム効果」モデルのバリアントもあります。

上記が「混合効果」モデルとの対比に役立つことを願っています。


+1、アレコスに感謝。これは役に立ちますが、そのすべてと混合モデルアプローチとの関係は、私にとっては不明なままです。私は、おそらくまったく関係がないと疑い始めます。推定値の間および内部(および内部はクラスダミーに相当する)は、明確です。私の混乱は、ランダム効果アプローチについてのみです。
アメーバは、モニカを復活させる
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.