Mundlak固定効果手順は、ダミーを使用したロジスティック回帰に適用できますか?


12

8000個のクラスターと400万個の観測値を含むデータセットがあります。残念ながら、統計データであるStataは、ロジスティック回帰にパネルデータ関数を使用すると、実行速度がかなり遅くなりxtlogitます。

ただし、非パネルlogit機能を使用すると、結果がより早く表示されます。そのためlogit、固定効果を説明する変更されたデータを使用することでメリットが得られる場合があります。

この手順は「Mundlak固定効果手順」(Mundlak、Y. 1978. Pooling of Time-Series and Cross-Section Data。Econometrica、46(1)、69-85。)

Antonakis、J.、Bendahan、S.、Jacquart、P。、およびLalive、R.(2010)の論文で、この手順の直感的な説明を見つけました因果関係の主張について:レビューと推奨事項。リーダーシップクォータリー、21(6)。1086-1120。私は引用する:

固定効果の省略の問題を回避し、レベル2変数を含める方法の1つは、推定モデルにすべてのレベル1共変量のクラスター平均を含めることです(Mundlak、1978)。クラスター平均は、回帰変数として含めるか、レベル1の共変量から差し引く(クラスター平均の中心化)ことができます。クラスター平均はクラスター内で不変で(クラスター間で異なる)、固定効果が含まれているかのようにレベル1パラメーターの一貫した推定を可能にします(Rabe-Hesketh&Skrondal、2008を参照)。

したがって、クラスター平均のセンタリングは、私の計算上の問題を解決するのに理想的かつ実用的と思われます。ただし、これらの論文は線形回帰(OLS)に向けられているようです。

このクラスター平均センタリングの方法は、固定効果の「複製」バイナリロジスティック回帰にも適用できますか?

同じ答えになるはずのより技術的な質問はxtlogit depvar indepvars, fe、データlogit depvar indepvarsセットBがデータセットAのクラスター平均中心バージョンであるときに、データセットA とデータセットBが等しいかどうかです。

このクラスター平均のセンタリングで私が見つけた追加の難点は、ダミーに対処する方法です。ダミーは0または1であるため、ランダム回帰と固定効果回帰では同一ですか?それらは「中心」にすべきではありませんか?

回答:


9

非線形モデルの場合、このようなトリックは観察されない固定効果を除去しないため、ロジットのようなモデルでは、最初の差分または変容などの変換は利用できません。固定効果を直接推定するためにN-1個のダミーを含めることが可能な、より小さなデータセットがあったとしても、データの時間ディメンションが大きくない限り、推定に偏りが生じます。したがって、パネルロジットの固定効果の除去は、差異も軽deも伴わず、ロジットの機能形式のためにのみ可能です。詳細に興味がある場合は、PDF 30ページ(ロジット/プロビットの軽mean /最初の違いが役に立たない理由の説明)と42ページ(パネルロジット推定量の紹介)でSöderbomによるこれらのメモを見ることができます。

別の問題はxtlogit、一般的なパネルロジットモデルでは、限界効果の計算に必要な固定効果を直接推定しないことです。それらがなければ、何時間もモデルを実行した後にがっかりするかもしれないあなたの係数を解釈することは非常に厄介です。

このような大きなデータセットと、前述のFEパネルロジットの概念上の難しさを利用して、線形確率モデルに固執します。私はこの答えがあなたを失望させないことを願っていますが、そのようなアドバイスを与えるための多くの理由があると思います:LPMははるかに高速で、係数はすぐに解釈できます(これは特に、モデルの相互作用効果がある場合に当てはまります非線形モデルの係数が変更されます!)、固定効果は簡単に制御でき、自己相関とクラスターの標準誤差を調整することができます。これがお役に立てば幸いです。


1
それは解決策ではありませんが、答えです。ありがとう:)
トム

1
小さな点:それらのスライドのp20があなたの主張を作りますが、Mundlak補正、別名「相関ランダム効果」モデルはp47で説明されており、そのような警告を伝えていないようです。
共役

1

条件付きロジット(Stataの「clogit」)は、代替の固定効果ロジットパネル推定器であると考えています。

http://www3.nd.edu/~rwilliam/stats3/Panel03-FixedEffects.pdf


5
サイトへようこそ!質問は実際には次のとおりであるため、これは受け入れられる答えではないと思います:推定を高速化する目的で、修正断面ロジスティック回帰による条件付き(固定効果)ロジスティック回帰を回避する方法。あなたの参照は(3ページの上部にある)を示しているように、「我々は、いずれかを使用することができますStataclogitコマンドまたはxtlogit, fe固定効果ロジット分析を行うには、コマンドを。同じ結果を与える両方。(実際には、私は信じてxtlogit, fe実際に呼び出しますclogit。)」 OP xtlogit, feは、最後から2番目の段落に基づいてすでに知っていました。
ランデル

0

アリソンは、Allison、(2009)、 "Fixed Effects Regression Models"、p.32fでこの問題について議論しています。

アリソンは、無条件モデルを最尤で推定することは不可能であると主張します。これは、「偶発的なパラメーターの問題」のためにモデルがバイアスされるためです。代わりに、条件付きロジットモデルの使用を推奨しています(Chamberlain、1980)。これは、各個人について観測されたイベントの数で尤度関数を調整することにより実現されます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.