固定効果が本当に修正されるのはいつですか?


12

タイプのリニア未観測効果モデルを考える: Cが観測されないが、時不変の特性であり、eは誤差であり、IおよびTのインデックス個々の観測と時間それぞれ。固定効果(FE)回帰の典型的なアプローチは、個々のダミー(LSDV)/軽meanまたは最初の差分によってc iを削除することです。

yit=Xitβ+ci+eit
ceitci

私がいつも疑問に思っていたのは、いつ本当に「修正」されるのかということです。ci

これは些細な質問に見えるかもしれませんが、その背後にある私の理由のために2つの例を挙げましょう。

  1. 今日人にインタビューし、彼女の収入、体重などを尋ねると、得られます。次の10日間、私たちはその同じ人に行き、毎日再び彼女にインタビューするので、彼女のためのパネルデータがあります。観測されていない特性は、将来の他の時点で確実に変化する場合、この10日間固定されたものとして扱う必要がありますか?10日後も彼女の個人的な能力は変わらないかもしれませんが、年をとると変わります。または、より極端な方法で質問します。この人に1時間に1日10時間インタビューすると、彼女の観察されていない特性はこの「サンプル」で修正される可能性がありますが、これはどれほど便利ですか。X

  2. 代わりに、85歳かそこらの人生の始まりから終わりまで、毎月人にインタビューするとします。今回は何が修正されますか?出生地、性別、目の色は最も可能性が高いですが、それを除けば、私は他に何も考えられません。しかしさらに重要なことは、もし彼女の人生のある一点で変化する特性があり、その変化が無限に小さい場合はどうでしょうか?その後、実際にはこの特性が準固定されたときに変化したため、もはや固定効果ではありません。

統計的な観点からは、固定効果とは何なのかは比較的明らかですが、直感的な観点からは、これを理解するのが難しいと感じています。他の誰かがこれらの考えを以前に持っていて、固定効果が実際に固定効果である場合についての議論を思いついたのかもしれません。このトピックに関する他の考えに感謝します。


2
+1、良い質問と良い答え。おそらく、それを覚えることの価値は、"all models are wrong, but some are useful"- ジョージ・ボックス
GUNG -復活モニカ

私はおそらくこのことについて混乱が、連続ではないですよ。あれば)1 すべてのために同じものとして扱われ、私ならば、あなたは)プールされたモデル、2を持っているC 私はすべてのために同じものとして扱われているのz J [ i ](グループのダミー変数。「年」または「日」を含めることができます)、FEモデルがあり、3)ciicizj[i]が分布として扱われる場合、REモデルがあります。参照:userwww.service.emory.edu/~tclark7/randomeffects.pdfをcj[i]
ウェイン

回答:


9

についての因果推論のためにこの定式化に関心がある場合、c iで表される未知の量は、関連する因果量を特定するために、研究/固定効果のデータの期間だけ安定している必要があります。 βci

表される量がこの期間でも安定していないことが心配な場合、固定効果はあなたが望むことをしません。ランダムなc iX iの間の相関が予想される場合でも、代わりにランダム効果を使用できますciciXiあなたが条件にしたいと思いˉ X Iにおけるマルチレベルの設定。多くの(すべてではない)状況では、それを心配する必要がないので、この相関関係への懸念は、多くの場合、固定効果の定式化の動機の1つです。ciX¯i

要するに、表される数量の変動に対する懸念は非常に合理的ですが、それは主に、あなたが持っていたかもしれない期間または最終的には持っているがそうではないかもしれない期間ではなく、あなたが持っている期間のデータに影響するためです。ci


+1この回答が気に入っています。しかし、サンプル期間中に修正されるはずの何かの信じられないほど小さな変化はどうでしょうか?10日間のサンプルの私の人が6日目に頭にぶつかり、その後、死んだ脳細胞によって表される非常に少ない量で知能が低下した場合(ほんの些細な例として):彼女の能力は、それが固定効果として扱われますか?ほぼ修正されていますか?
アンディ

1
承知しました。多分このように考えてみてください:固定されたパラメータであり、世界で「本当に」一定の何かを表す場合もあれば、実際に変化する何かの平均を表す場合など、そうでない場合もあります。問題は、他の何かではなく固定効果を与えるために、どのような推測上の違いが生じるかです。因果推論の場合、問題は次のとおりです。固定効果交絡を減少せると仮定すると、パラメータによって捕捉されない小さな変動交絡を増加させます。
共役前

@アンディ:いくつかの脳細胞が外傷を受けたために誰かのIQを変える頭への衝突について話し始めると、それはどこで止まりますか?現実世界で測定するものは、十分に正確に測定できれば、時々刻々と(無限に)変化しないほど固定されています。合理的な判断を下すだけで、結果を述べる際にその判断について明確にする必要があります。共役優先者が言うように、固定効果は「変更不可能」とは異なる概念でもあり、特定の事柄(パラメーター)と特定の目標(人口、グループなど)の両方を指します。
ウェイン

あなたは、脳細胞を使用した例がいくぶんフェッチされていることは正しいです。ほとんどの教科書や講義では、この直感的な側面についてはかなり静かなので、固定効果の性質についてもっと考えたかっただけです。確かに彼らは例を挙げていますが、どれも私の質問に答えません。この目的のために、私はこの質問をここに持ち出すことが非常に有用であり、これまでの回答とコメントが非常に有用であることを発見しました。
アンディ

2

固定効果とランダム効果の区別は、効率の問題を除いて、通常、推定値に影響を与えません(編集:少なくとも単純な教科書では相関のない場合)が、テストにはかなりの意味があります。

テストのために、あなた自身に問うべき質問は、あなたの信号が超えるべきノイズのレベルは何ですか?つまり、調査結果をどの人口に一般化したいですか?例(1)の使用:それは同じ日の変動、より長い期間、または異なる個人の変動でしょうか?

E(ciE(ci)Xi重量ではなく、一人の被験者の一部の生活期間にわたってではなく、すべての上の哺乳類


X

cXc

ciE(ci)

@アンディ:効果とREのノイズとの相関関係を考慮しない理由は見当たりませんが、答えの残りに同意する場合は、単に答えを編集します。
ジョンロス

2

Xitβ

yit=ci+eit

時間をさかのぼると、ランダムウォークと見なすことができます。

yit=ci+eityit1=ci+eit1yityit1=eiteit1

Xitβeit

ci

アンケートの特定の例では、フロータイプデータ(収入、体重など)を測定する質問は、特に短い時間枠でランダムウォークするので合理的かもしれません。ただし、在庫タイプのデータ(今日は何杯のコーヒーを飲んだかなど)は、やや誤った推測のようです。


+1リンクと回答をありがとう!この質問がまだ関心を集めており、さらに質問を追加できることを嬉しく思います。これは洞察力に富んだものでした。
アンディ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.