データセットの最適な仕様を見つけようとしています。
説明された変数について、3つの同様のパネルデータモデルで経済成長の意味でポーランドの特別経済区の有効性を調査しようとしています。a)登録失業率b)1人あたりのGDP c)1人あたりの総固定資本形成。データはNUTS3サブリージョン用です。説明変数は次のとおりです年のサブリージョンにSEZが存在する場合は0-1 、いくつかの経済変数。年間の頻度、データセットは66のサブリージョンの2004〜2012です。
固定効果とランダム効果を試しました。今のところ、私は重要性と理論的に正しい兆候があるため、FEを選択しました。しかし、私がそれを当たり前のことと見なすのを妨げるいくつかの問題があります:
自己相関と相互相関をテストする方法は?
Stataでエラー項の分布をテストする方法がわかりません。さらに、それが正常に分布していない場合は、あまり気にする必要がありますか?
文献からわかるように、説明変数と-1または1に近い誤差項の間の相関係数の値は、実際には悪くありません。私の場合は、ご覧のとおり、ほぼ-1です。
混合モデルは私のデータセットに適していますか?
失業率を説明するモデルの結果を添付します。
コード:
xtreg st_bezr sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2, fe
Fixed-effects (within) regression Number of obs = 594
Group variable: id Number of groups = 66
R-sq: within = 0.4427 Obs per group: min = 9
between = 0.3479 avg = 9.0
overall = 0.2365 max = 9
F(6,522) = 69.10
corr(u_i, Xb) = -0.9961 Prob > F = 0.0000
-------------------------------------------------------------------------------------------
st_bezr | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
sse01 | -1.406066 .4631984 -3.04 0.003 -2.316028 -.4961045
wartosc_sr_trw_per_capita | -.0000963 .0000166 -5.79 0.000 -.0001289 -.0000636
zatr_przem_bud | -26.11989 4.992198 -5.23 0.000 -35.92716 -16.31263
podm_gosp_na_10tys_ludn | -.0201788 .0030788 -6.55 0.000 -.0262273 -.0141304
proc_ludn_wiek_prod | -229.1996 16.92631 -13.54 0.000 -262.4516 -195.9475
ludnosc_na_km2 | .0790167 .0120865 6.54 0.000 .0552726 .1027609
_cons | 161.9786 10.76989 15.04 0.000 140.821 183.1363
--------------------------+----------------------------------------------------------------
sigma_u | 53.986519
sigma_e | 2.5446248
rho | .99778327 (fraction of variance due to u_i)
-------------------------------------------------------------------------------------------
F test that all u_i=0: F(65, 522) = 27.09 Prob > F = 0.0000