従属変数のラグを回帰モデルに含める必要があるのはいつですか？どのラグですか？

従属変数として使用するデータは次のようになります（カウントデータです）。周期的な要素とトレンド構造を持っているため、回帰が何らかの形で偏っていることがわかります。

ここに画像の説明を入力してください

役立つ場合に備えて、負の二項回帰を使用します。データは、個人（州）ごとに1つのダミーのバランスパネルです。表示されている画像には、すべての状態の従属変数の合計が表示されていますが、ほとんどの状態のみが同様の動作をしています。固定効果モデルを検討しています。従属変数はあまり強く相関しておらず、研究の一部はこの変数間の予期しない関係を見つけることであるため、弱い関係は実際には良いものです。

従属変数の遅延変数を含めないことの正確な危険性は何ですか？

1つ含める必要がある場合、どの1つをテストする必要がありますか。

実装はRで行われています。

注：私はこの投稿を読みましたが、問題の解決にはなりませんでした。

— マウリシオGテック
ソース

殺人に対する一目reれの報復モデルがある場合、動的パネルモデルは理にかなっている可能性があります。たとえば、殺人率が主にギャングの確執によって引き起こされた場合、時間での殺人はでの死亡または他の遅れの関数である可能性があります。 $t$ $t-1$

あなたの質問に順不同で答えます。DGPが

y_{私 t} = δ y_{私 t - 1} + {バツ}_{私 t}^{'} β + μ_{私} + v_{私 t} 、

$\begin{equation} y_{it}=\delta y_{it-1}+x_{it}^{\prime}\beta+\mu_{i}+v_{it}, \end{equation}$

エラーとは互いに独立しており、相互に独立しています。かどうかのテストを行うことに興味があります（質問2）。 $\mu$ $v$ $\delta = 0$

OLSを使用する場合、とエラーの最初の部分が相関していることが簡単にわかります。これにより、シリアル相関がない場合でも、OLSにバイアスがかかり、一貫性がなくなります。テストを行うにはもっと複雑なものが必要です。 $y_{it-1}$ $v$

次に試すことができるのは、各単位の平均、を各観測から減算することでデータを変換する、変換内の固定効果推定器です。このワイプアウトから、この推定量を被るNickellバイアスバイアスは観測数として消えない、それが大のために矛盾しているので、成長と小さなパネル。ただし、が大きくなると、と一貫性が得られます。Judson and Owen（1999）は、およびいくつかのシミュレーションを行います $y$ $\bar y_{i}$ $\mu$ $N$ $N$ $T$ $T$ $\delta$ $\beta$ $N=20,100$ $T=5,10,20,30$ そして、バイアスはで増加し、で減少することがわかりました。ただし、場合でも、バイアスは真の係数値のになる可能性があります。それは悪い知らせです！そのため、パネルの寸法に応じて、FE推定内を避けることができます。場合の持続ので、バイアスは、負である過小評価されています。リグレッサーがラグと相関している場合、もバイアスされます。 $\delta$ $T$ $T=30$ $20\%$ $\delta > 0$ $y$ $\beta$

もう1つの単純なFEアプローチは、データを最初に差分して固定効果を除去し、を使用して。また、をそれ自体の手段として使用します。Anderson and Hsiao（1981）は標準的な参照です。この推定量は一貫しています（説明のが事前に決定され、元のエラー項が連続相関していない限り）が、利用可能なすべてのモーメント条件を使用せず、エラーが発生するという事実を使用しないため、完全に効率的ではありません今では用語が異なります。これがおそらく私の最初の選択でしょう。もしあなたがその $y_{it-2}$ $\Delta y_{it-1} = y_{it-1}-y_{it-2}$ $x_{it}-x_{it-1}$ $X$ $v$ AR（1）プロセスに従い、代わりに 3番目と4番目のラグを使用できます。 $y$

Arellano and Bond（1991）は、より効率的な一般化モーメント法（GMM）推定量を導き出しました。Baltagiのパネルブックの第8章は、この文献の優れた調査ですが、私が知る限りラグ選択を扱っていません。これは最先端のメトリックですが、より技術的に要求が厳しいです。

R のplmパッケージにはこれらの一部が組み込まれていると思います。動的パネルモデルはバージョン10以降 Stata にあり、SASには少なくともGMMバージョンがあります。これらはいずれもカウントデータモデルではありませんが、データによっては大した問題ではない場合があります。ただし、StataのGMM動的ポアソンパネルモデルの例を次に示します。

最初の質問に対する答えは、より投機的です。遅れたと最初の差を省くと、分散が大きくなったため正確性は低下しますが、は一貫して推定できると思います。それがあなたが気にするパラメータであるなら、それは受け入れられるかもしれません。あなたが失ったのは、先月多くの殺人があったか、または地域Xが暴力の傾向があるために、地域Xに多くの殺人があったかどうか言うことができないということです。状態依存性と観測されていない異質性を区別する機能を放棄します（質問1）。 $y$ $\beta$

— ディミトリV.マスターフ
ソース

異なるシリーズがある場合はレベルを楽器として使用し、レベルにシリーズがある場合はそのレベルを使用しますか？

— アンディW

滴下添字を、次のいずれかを使用することができる又は差分するための器具として。Arellano（1989）は、最初のアプローチには特異点があり、広範囲のパラメーター値に対して大きな分散があることを示しています。レベルの楽器にはどちらもありません。だから私はそれをお勧めします

i

$i$

Δ y_{t - 2} = y_{t} - 2 - y_{t - 3}

$\Delta y_{t−2}=y_{t}−2−y_{t−3}$

y_{t - 2}

$y_{t-2}$

Δ y_{t - 1} = y_{t - 1} - y_{t - 2}

$\Delta y_{t−1}=y_{t-1}−y_{t−2}$

— Dimitriy V. Masterov