パネルデータの仕様

データセットの最適な仕様を見つけようとしています。

説明された変数について、3つの同様のパネルデータモデルで経済成長の意味でポーランドの特別経済区の有効性を調査しようとしています。a）登録失業率b）1人あたりのGDP c）1人あたりの総固定資本形成。データはNUTS3サブリージョン用です。説明変数は次のとおりです年のサブリージョンにSEZが存在する場合は0-1 、いくつかの経済変数。年間の頻度、データセットは66のサブリージョンの2004〜2012です。 $t$

固定効果とランダム効果を試しました。今のところ、私は重要性と理論的に正しい兆候があるため、FEを選択しました。しかし、私がそれを当たり前のことと見なすのを妨げるいくつかの問題があります：

自己相関と相互相関をテストする方法は？
Stataでエラー項の分布をテストする方法がわかりません。さらに、それが正常に分布していない場合は、あまり気にする必要がありますか？
文献からわかるように、説明変数と-1または1に近い誤差項の間の相関係数の値は、実際には悪くありません。私の場合は、ご覧のとおり、ほぼ-1です。
混合モデルは私のデータセットに適していますか？

失業率を説明するモデルの結果を添付します。

コード：

xtreg  st_bezr sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2, fe

Fixed-effects (within) regression               Number of obs      =       594
Group variable: id                              Number of groups   =        66

R-sq:  within  = 0.4427                         Obs per group: min =         9
       between = 0.3479                                        avg =       9.0
       overall = 0.2365                                        max =         9

                                                F(6,522)           =     69.10
corr(u_i, Xb)  = -0.9961                        Prob > F           =    0.0000

-------------------------------------------------------------------------------------------
                  st_bezr |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
                    sse01 |  -1.406066   .4631984    -3.04   0.003    -2.316028   -.4961045
wartosc_sr_trw_per_capita |  -.0000963   .0000166    -5.79   0.000    -.0001289   -.0000636
           zatr_przem_bud |  -26.11989   4.992198    -5.23   0.000    -35.92716   -16.31263
  podm_gosp_na_10tys_ludn |  -.0201788   .0030788    -6.55   0.000    -.0262273   -.0141304
      proc_ludn_wiek_prod |  -229.1996   16.92631   -13.54   0.000    -262.4516   -195.9475
           ludnosc_na_km2 |   .0790167   .0120865     6.54   0.000     .0552726    .1027609
                    _cons |   161.9786   10.76989    15.04   0.000      140.821    183.1363
--------------------------+----------------------------------------------------------------
                  sigma_u |  53.986519
                  sigma_e |  2.5446248
                      rho |  .99778327   (fraction of variance due to u_i)
-------------------------------------------------------------------------------------------
F test that all u_i=0:     F(65, 522) =    27.09             Prob > F = 0.0000

— チャーリー9207
ソース

この回答のStataコマンドの場合、ローカルで変数を収集します。
local xlist sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2
つまり、すべての変数を常に「xlist」で呼び出すことができます

1）固定効果の回帰後に使用できるコマンドは2つあります。

xttest2残差間の依存性がないという帰無仮説を使用してBreusch-Pagan LM検定を実行します。これは、同時相関のテストです。nullを拒否しないということは、テストが残差の断面依存を検出しなかったことを意味します。
xttest3グループごとの異分散性について、Waldテストの修正版を実行します。帰無仮説は等分散性です。

ssc instal xttest2とを入力して、両方のコマンドをインストールできますssc instal xttest3。あなたは残差間の相関を検出した場合、あなたは強力なオプションでこれを修正することができます：
xtreg st_bezr 'xlist', fe robust

自己相関をテストするために、あなたは経由ラグランジュ乗数検定を適用することができますxtserial：
xtserial st_bezr 'xlist'
帰無仮説なしシリアル相関関係はありません。シリアル相関と異分散性の両方を修正するには、id変数でクラスターオプションを使用できます。
xtreg st_bezr 'xlist', fe cluster(id)

2）残差の正規性検定の場合：predict res, e固定効果の回帰後、予測コマンドを使用して残差を取得できます。目視検査には以下を使用できます。

kdensity res, normal （残差の分布をプロットし、正規分布と比較します）
pnorm res （標準化された正規確率プロットをプロットします）
qnorm res （正規分布の分位数に対して残差の分位数をプロットします）

pnormを使用すると、分布の中央に非正規性があるかどうかを確認でき、qnormを使用すると、裾に非正規性があることがわかります。正式なテストはによって取得できますswilk res。帰無仮説は、残差が正規分布しているというものです。一般的に、非正規性はそれほど大きな問題ではありませんが、推論にとって重要です。堅牢なオプションでこれを修正できます。

corr(u_i, Xb) = -0.9961 $u_i$ $X\beta$

4）一般的にはい。ただし、推定したいもの、またはデータをどのように処理できるか、つまり変数がランダム変数かどうかによって異なります。ここではきっとあなたを助ける@mpiktasによって混合効果とパネルデータモデルの違いのための優れた説明があります。

— アンディ
ソース