タグ付けされた質問 「fixed-effects-model」

生物統計学では、固定効果は人口平均効果を意味する場合があります。計量経済学では、固定効果は、量が非ランダムであるかのように扱われる説明変数に関して観測された量を表す場合があります。

3
3因子ANOVAテーブルから因子を削除する
最近の論文で、3方向の固定効果モデルを適合させました。要因の1つは重要ではなかったため(p> 0.1)、それを削除し、2つの固定効果と相互作用でモデルを再適合させました。 引用するために、審判からコメントが返ってきました。 その時間は3因子ANOVAの重要な要因ではありませんでしたが、それ自体は時間要因をプールするための十分な基準ではありません。この問題に関する標準テキスト、Underwood 1997は、非有意効果のp値は因子の治療レベルをプールする前に0.25を超える。著者は、関連するp値をここに示し、Underwood 1997を参照してプーリングを正当化する必要があります。 私の質問は: 0.25ルールは聞いたことがありません。他に誰かいますか?p値がカットオフに近い場合、因子を削除しないことを理解できますが、「ルール」を持つことは少し極端に思えます。 この審判は、Underwood 1997が標準テキストであると述べています。本当か?そのようなことを聞​​いたのは初めてだ。標準テキストは何ですか(そのようなものは存在しますか)?残念ながら、1997年にこのUnderwoodにアクセスすることはできません。 審判に返答する際のアドバイス。 背景:この論文は非統計ジャーナルに投稿されました。3方向モデルをフィッティングするとき、相互作用効果をチェックしました。

1
パネルデータモデルのグループ内の標準化された従属変数?
識別グループ内の従属変数の標準化は意味がありますか? 次のワーキングペーパー(リーガルアマゾンでの森林破壊の減速、価格またはポリシー?、pdf)では、標準化された従属変数を使用して、森林破壊に対するブラジルの一般的な政策変更の影響を分析しています。 標準化は次のように行われます: YN E W私トン= Y私トン− Y私¯¯¯¯¯s d(Y私トン)Y私tnew=Y私t−Y私¯sd(Y私t) Y^{new}_{it} = \frac{Y_{it} - \overline{Y_i}}{sd(Y_{it})} 著者は、これは「自治体内の森林減少の相対的な変動を考慮する」のに役立つと主張している。著者は、パネルデータのFE推定(12ページ)を使用します。新しい法律の後、翌年ごとに政策後ダミーを含める。 従属変数がこのように標準化された場合、係数はどのように解釈されるべきですか? 標準化は、グループ/市町村が時間の経過とともにより低い変動を経験した観測により高い値を与えるため、非正統的ではありませんか?

3
固定効果が本当に修正されるのはいつですか?
タイプのリニア未観測効果モデルを考える: Cが観測されないが、時不変の特性であり、eは誤差であり、IおよびTのインデックス個々の観測と時間それぞれ。固定効果(FE)回帰の典型的なアプローチは、個々のダミー(LSDV)/軽meanまたは最初の差分によってc iを削除することです。yit=Xitβ+ci+eityit=Xitβ+ci+eity_{it} = X_{it}\beta + c_{i} + e_{it}ccceeeiiitttcicic_{i} 私がいつも疑問に思っていたのは、いつ本当に「修正」されるのかということです。cicic_{i} これは些細な質問に見えるかもしれませんが、その背後にある私の理由のために2つの例を挙げましょう。 今日人にインタビューし、彼女の収入、体重などを尋ねると、得られます。次の10日間、私たちはその同じ人に行き、毎日再び彼女にインタビューするので、彼女のためのパネルデータがあります。観測されていない特性は、将来の他の時点で確実に変化する場合、この10日間固定されたものとして扱う必要がありますか?10日後も彼女の個人的な能力は変わらないかもしれませんが、年をとると変わります。または、より極端な方法で質問します。この人に1時間に1日10時間インタビューすると、彼女の観察されていない特性はこの「サンプル」で修正される可能性がありますが、これはどれほど便利ですか。XXX 代わりに、85歳かそこらの人生の始まりから終わりまで、毎月人にインタビューするとします。今回は何が修正されますか?出生地、性別、目の色は最も可能性が高いですが、それを除けば、私は他に何も考えられません。しかしさらに重要なことは、もし彼女の人生のある一点で変化する特性があり、その変化が無限に小さい場合はどうでしょうか?その後、実際にはこの特性が準固定されたときに変化したため、もはや固定効果ではありません。 統計的な観点からは、固定効果とは何なのかは比較的明らかですが、直感的な観点からは、これを理解するのが難しいと感じています。他の誰かがこれらの考えを以前に持っていて、固定効果が実際に固定効果である場合についての議論を思いついたのかもしれません。このトピックに関する他の考えに感謝します。

3
Mundlak固定効果手順は、ダミーを使用したロジスティック回帰に適用できますか?
8000個のクラスターと400万個の観測値を含むデータセットがあります。残念ながら、統計データであるStataは、ロジスティック回帰にパネルデータ関数を使用すると、実行速度がかなり遅くなりxtlogitます。 ただし、非パネルlogit機能を使用すると、結果がより早く表示されます。そのためlogit、固定効果を説明する変更されたデータを使用することでメリットが得られる場合があります。 この手順は「Mundlak固定効果手順」(Mundlak、Y. 1978. Pooling of Time-Series and Cross-Section Data。Econometrica、46(1)、69-85。) Antonakis、J.、Bendahan、S.、Jacquart、P。、およびLalive、R.(2010)の論文で、この手順の直感的な説明を見つけました。因果関係の主張について:レビューと推奨事項。リーダーシップクォータリー、21(6)。1086-1120。私は引用する: 固定効果の省略の問題を回避し、レベル2変数を含める方法の1つは、推定モデルにすべてのレベル1共変量のクラスター平均を含めることです(Mundlak、1978)。クラスター平均は、回帰変数として含めるか、レベル1の共変量から差し引く(クラスター平均の中心化)ことができます。クラスター平均はクラスター内で不変で(クラスター間で異なる)、固定効果が含まれているかのようにレベル1パラメーターの一貫した推定を可能にします(Rabe-Hesketh&Skrondal、2008を参照)。 したがって、クラスター平均のセンタリングは、私の計算上の問題を解決するのに理想的かつ実用的と思われます。ただし、これらの論文は線形回帰(OLS)に向けられているようです。 このクラスター平均センタリングの方法は、固定効果の「複製」バイナリロジスティック回帰にも適用できますか? 同じ答えになるはずのより技術的な質問はxtlogit depvar indepvars, fe、データlogit depvar indepvarsセットBがデータセットAのクラスター平均中心バージョンであるときに、データセットA とデータセットBが等しいかどうかです。 このクラスター平均のセンタリングで私が見つけた追加の難点は、ダミーに対処する方法です。ダミーは0または1であるため、ランダム回帰と固定効果回帰では同一ですか?それらは「中心」にすべきではありませんか?

1
RのPROC Mixedとlme / lmerの違い-自由度
注:法的な理由で以前の質問を削除する必要があったため、この質問は再投稿です。 SASのPROC MIXED をR lmeのnlmeパッケージの関数と比較していると、やや紛らわしい違いを見つけました。より具体的には、異なるテストの自由度はとの間PROC MIXEDで異なり、lmeなぜだろうと思いました。 次のデータセットから開始します(以下のRコード)。 ind:測定が行われる個人を示す因子 fac:測定が行われる臓器 trt:治療を示す因子 y:連続応答変数 アイデアは、次の単純なモデルを構築することです: y ~ trt + (ind):indランダムな要因として y ~ trt + (fac(ind)):facにネストされたindランダムな要因として、 最後のモデルでは特異性が生じることに注意してください。とのyすべての組み合わせに対しての値は1つだけです。indfac 最初のモデル SASでは、次のモデルを作成します。 PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; チュートリアルによると、使用しているRの同じモデルnlmeは次のようになります。 > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 両方のモデルは、係数とそのSEに対して同じ推定値を与えますがtrt、の効果に対してF検定を実行する場合、異なる自由度を使用します。 SAS …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
個々のレベルのパネルデータとの差異の違い
個々のレベルパネルデータを使用して、差異モデルの差異を指定する正しい方法は何ですか? セットアップは次のとおりです。都市に複数年にわたって埋め込まれた個人レベルのパネルデータがあり、その扱いは都市の年レベルで異なると想定します。正式には、聞かせて、個々のための結果であるの街のと年のとかどうか介入被災都市のためのダミーなるで年間。Bertrand et al(2004、p。250)で概説されているような典型的なDiD推定量は、都市と年の固定効果項を持つ単純なOLSモデルに基づいています。yistyisty_{ist}iiissstttDstDstD_{st}sssttt yist=As+Bt+cXist+βDst+ϵistyist=As+Bt+cXist+βDst+ϵist y_{ist} = A_{s} + B_t + cX_{ist} + \beta D_{st} + \epsilon_{ist} しかし、その推定者は個人レベルのパネル構造(つまり、都市内の各個人の複数の観測)を無視しますか?このモデルを個別レベルの固定効果項拡張することには意味がありますか?多くのDiDアプリケーションは、個々のレベルのパネルデータなしで繰り返し断面データを使用します。SiSiS_i バートランド、マリアンヌ、エスターデュフロ、センディルマライナサン。2004.「差の差の見積もりをどれだけ信頼すべきですか?」Quarterly Journal of Economics 119(1):249–75。

2
変量効果モデルでは効果が入力変数と無相関である必要があるのに、固定効果モデルでは相関が可能になるのはなぜですか?
ウィキペディアから 個々の特定の効果について行われる2つの一般的な仮定は、変量効果の仮定と固定効果の仮定です。変量効果の仮定(変量効果モデルで作成)は、個々の特定の効果が独立変数と無相関であることです。固定効果の仮定は、個々の特定の効果が独立変数と相関しているというものです。変量効果の仮定が成り立つ場合、変量効果モデルは固定効果モデルよりも効率的です。ただし、この仮定が成り立たない場合(つまり、ダービンワトソン検定が失敗した場合)、変量効果モデルは一貫していません。 変量効果モデルでは変量効果が入力変数と無相関である必要があるのに、固定効果モデルでは効果を入力変数と相関させることができるのはなぜですか。 ありがとう!

1
固定効果モデルで省略されたダミー変数を処理する方法は?
私のハウスマン試験値を示しているので、私は私のパネルデータの固定効果モデル(9年、1000+ OBS)を使用しています。私の会社が含む業界のダミー変数を追加すると、それらは常に省略されます。DV(開示指数)に関しては、さまざまな業界グループの間で大きな違いがあることを知っています。しかし、Stataを使用している場合、モデルでそれらを取得できません。(Pr &gt; χ2)&lt; 0.05(Pr&gt;χ2)&lt;0.05(Pr>\chi^2)<0.05 これを解決する方法はありますか?そしてなぜそれらは省略されているのですか?

2
縦断的研究で平均治療効果を推定する最良の方法は何ですか?
縦断的研究では、ユニット結果が時点で繰り返し測定され、合計固定測定機会があります(固定=ユニットの測定は同時に行われます)。YitYitY_{it}iiitttmmm 単位は、治療、または対照群いずれかにランダムに割り当てられます。治療の平均的な効果を推定してテストしたいと思います。つまり、時間と個人全体で期待値が得られます。この目的のために、固定された機会のマルチレベル(混合効果)モデルの使用を検討します。G=1G=1G=1G=0G=0G=0ATE=E(Y|G=1)−E(Y|G=0),ATE=E(Y|G=1)−E(Y|G=0),ATE=E(Y | G=1) - E(Y | G=0), Yit=α+βGi+u0i+eitYit=α+βGi+u0i+eitY_{it} = \alpha + \beta G_i + u_{0i} + e_{it} インターセプト、、ユニットにわたってランダム切片、及び残差を。αα\alphaββ\betaATEATEATEuuueee 今、私は代替モデルを検討しています Yit=β~Gi+∑j=1mκjdij+∑j=1mγjdijGi+u~0i+e~itYit=β~Gi+∑j=1mκjdij+∑j=1mγjdijGi+u~0i+e~itY_{it} = \tilde{\beta} G_i + \sum_{j=1}^m \kappa_j d_{ij} + \sum_{j=1}^m \gamma_j d_{ij} G_i + \tilde{u}_{0i} + \tilde{e}_{it} これは固定効果が含ま都度のためのダミー場合と他。さらに、このモデルには、パラメータを使用した治療と時間の相互作用が含まれています。したがって、このモデルでは、の影響が時間の経過とともに異なる可能性があることを考慮しています。これ自体は参考情報ですが、の不均一性が考慮されるため、パラメーターの推定の精度も向上するはずです。κjκj\kappa_jtttdt=1dt=1d_t=1j=tj=tj=t000γγ\gammaGGGYYY ただし、このモデルでは、係数はと等しくないようです。代わりに、最初にATEを表します()。推定だからよりも効率的かもしれが、それは表していませんもう。β~β~\tilde{\beta}ATEATEATEt=1t=1t=1β~β~\tilde{\beta}ββ\betaATEATEATE 私の質問は: この縦断的研究デザインで治療効果を推定する最良の方法は何ですか? モデル1を使用する必要がありますか、それとも(おそらくより効率的な)モデル2を使用する方法はありますか? にの解釈との機会固有の偏差を持たせる方法はありますか(たとえば、エフェクトコーディングを使用して)?β~β~\tilde{\beta}ATEATEATEγγ\gamma

5
階層/マルチレベルデータのブートストラップ(クラスターのリサンプリング)
cats(-MASS-パッケージから)データセットからブートストラップサンプルを作成するためのスクリプトを作成しています。 DavidsonとHinkleyの教科書[1]に従い、私は単純な線形回帰を実行し、iidの観測、つまりペアのリサンプリングからブートストラップするための基本的なノンパラメトリック手順を採用しました。 元のサンプルは次の形式です。 Bwt Hwt 2.0 7.0 2.1 7.2 ... 1.9 6.8 単変量線形モデルを通じて、猫の囲いの重量を脳の重量で説明したいと思います。 コードは次のとおりです。 library(MASS) library(boot) ################## # CATS MODEL # ################## cats.lm &lt;- glm(Hwt ~ Bwt, data=cats) cats.diag &lt;- glm.diag.plots(cats.lm, ret=T) ####################### # CASE resampling # ####################### cats.fit &lt;- function(data) coef(glm(data$Hwt ~ data$Bwt)) statistic.coef &lt;- function(data, i) cats.fit(data[i,]) bootl …

1
パネルデータ:プールされたOLS対RE対FE効果
FEと比較したPooled-OLSおよびRE Estimatorの有用性について、いくつかの議論がありました。 つまり、私が知る限り、プールされたOLS推定は、単にPanelデータに対して実行されるOLS手法です。したがって、個々に固有の影響はすべて完全に無視されます。そのため、誤差項の直交性などの基本的な仮定の多くに違反しています。 REは、ランダムであると想定されるモデルに個別の仕様インターセプトを実装することによってこの問題を解決します。これは、モデルの完全な外来性を意味します。これはHausmann-Testでテストできます。 ほとんどすべてのモデルにはいくつかの内因性の問題があるため、FE-Estimationは最良の選択であり、最良の一貫した推定を提供しますが、個々の特定のパラメーターは失われます。 私が自問している質問は、プールされたOLSまたはランダム効果を使用することが実際に意味があるのはいつかということです。プールされたOLSは非常に多くの仮定に違反しているため、まったく意味がありません。また、RE-Estimatorの強力な外因性は基本的に与えられないので、いつそれが実際に役立つのでしょうか? これに加えて、すべてのモデルで、自己相関は考慮できませんか?

1
(参考資料)単に記憶するだけでなく、実験計画モデルをどのように導き出すか?
私が取っているMSレベルの統計手法クラスでは、実験計画のためのさまざまな線形モデルについて学びました。たとえば、 ランダム化完全ブロック設計(RCBD)モデルの場合、 ます(はブロックを表し、は処理を表します)、ブロック効果を表す(固定)治療効果、一部分布以下。I J β τ ε I J N(0 、σ 2 ε)Y私はj= μ + β私+ τj+ ε私はj、Yij=μ+βi+τj+εij,Y_{ij} = \mu + \beta_i + \tau_j + \varepsilon_{ij}\,,私iijjjββ\betaττ\tauε私はjεij\varepsilon_{ij}N(0 、σ2ε)N(0,σε2)\mathcal{N}(0, \sigma^2_{\varepsilon}) このモデルのように直感的に理解できるように、方程式を覚えるだけでなく、1レベル深く掘り下げて、このモデルがどのように派生するかを理解したいと思います。 質問: RCBDや他の実験計画モデルのこの方程式を導き出す情報源を誰かに紹介してもらえますか? 回答による編集:これを尋ねる理由は、ChristansenのPlanes Answers to Complex Questions(付録G)で、単純なランダムサンプリング方程式、完全にランダム化された設計方程式およびランダム化された完全なブロック設計方程式、「ランダム化理論に基づいたより適切なモデルへの適切な近似」として。以前、彼は述べています、Y I J = μ I + E I J Y I J = α …

1
性差別のためのハウスマンテストの使い方は?
スウェーデンの大企業の男女の男女の賃金格差を推定して、性差別の有無をテストしています。Hausmanテストは、個々の固定効果がランダムであるため、プールされたOLSまたはランダム効果に依存することができないというnullを拒否します。問題は、時間の経過とともに変化しないため、女性ダミーを固定効果回帰に維持できないことです。 差別をテストするために代わりにハウスマンテストを使用するよう提案されましたが、これをどのように使用して男性と女性の労働者の収入の差を見つける必要があるのか​​実際にはわかりません。多分ここの誰かがこのアドバイスをもう少しよく理解してくれることを望んでいました。もしそうなら、私にこれについていくつかの光を当ててもらえますか?

1
固定効果による差異の差異
DDモデルに固定効果があることに関して2つの質問があります。 異なる時期に発生する治療を受けています(例:2001、2005など)。DDモデルに適合させたいので、治療年数は年々「0」を治療時間として標準化しています。治療年の不均一性を制御するために、私は真の年の固定効果を含めました。 y私トン= β0+ β1治療+ β2+ βの後3(トリート ⋅ 後)+ η(年固定効果)+ γC私トン+ ϵ私トンyit=β0+β1Treat+β2After+β3(Treat ⋅ After)+η(Year Fixed Effects)+γCit+ϵity_{it} = \beta_0 + \beta_1 \text{Treat} + \beta_2 \text{After} + \beta_3 (\text{Treat $\cdot$ After}) + \eta (\text{Year Fixed Effects})+ \gamma C_{it} + \epsilon_{it} 質問1:このモデルに問題はありますか? 質問2:このDDモデルに時定数の固定効果を含めることに問題はありますか?たとえば、iレベルの固定効果()および/またはi固定効果のグループ指標(たとえば、男性/女性または人種)を含めるとどうなりますか?DDが時定数i-lvl FEをキャンセルすることに気づきましたが、ここに再度含めるとどうなりますか?α私αi\alpha_i

1
パネルデータの仕様
データセットの最適な仕様を見つけようとしています。 説明された変数について、3つの同様のパネルデータモデルで経済成長の意味でポーランドの特別経済区の有効性を調査しようとしています。a)登録失業率b)1人あたりのGDP c)1人あたりの総固定資本形成。データはNUTS3サブリージョン用です。説明変数は次のとおりです年のサブリージョンにSEZが存在する場合は0-1 、いくつかの経済変数。年間の頻度、データセットは66のサブリージョンの2004〜2012です。ttt 固定効果とランダム効果を試しました。今のところ、私は重要性と理論的に正しい兆候があるため、FEを選択しました。しかし、私がそれを当たり前のことと見なすのを妨げるいくつかの問題があります: 自己相関と相互相関をテストする方法は? Stataでエラー項の分布をテストする方法がわかりません。さらに、それが正常に分布していない場合は、あまり気にする必要がありますか? 文献からわかるように、説明変数と-1または1に近い誤差項の間の相関係数の値は、実際には悪くありません。私の場合は、ご覧のとおり、ほぼ-1です。 混合モデルは私のデータセットに適していますか? 失業率を説明するモデルの結果を添付します。 コード: xtreg st_bezr sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2, fe Fixed-effects (within) regression Number of obs = 594 Group variable: id Number of groups = 66 R-sq: within = 0.4427 Obs per group: min = 9 between = 0.3479 avg …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.