タグ付けされた質問 「endogeneity」

3
クラスターSEを使用する場合と固定効果を使用する場合
あなたは、個人がグループ内に配置されているデータの単一断面(学校内などの生徒を)持っていて、フォームのモデルを推定したいと仮定し、個々のレベル特性とのベクトルである定数を。Y_i = a + B*X_iXa この場合、観測されていないグループ間不均一B性が、対象の独立変数と相関しているため、ポイント推定値とそのSEにバイアスをかけていると仮定します。 1つのオプションは、グループ(学校)によってSEをクラスター化することです。もう1つは、グループFEを含めることです。別の方法は両方を使用することです。これらのオプションを選択する際に考慮すべきことは何ですか?グループごとにSEをクラスタ化し、グループFEを使用する理由は特に不明です。私の特定のケースでは、35のグループと、各グループ内にネストされた5,000人の個人がいます。このpdfの説明に従いましたが、クラスター化されたSEと固定効果の両方を使用する理由と時期についてはあまり明確ではありません。 (マルチレベルモデルに適合することを提案する代わりに、クラスター化されたSEとFEの長所と短所について議論してください。)

3
2段階モデル​​:Heckmanモデル(サンプル選択を処理するため)とInstrumental変数(内因性を処理するため)の違い
私は、サンプル選択と内因性の違いと、(サンプル選択を処理するための)Heckmanモデルが(内因性を処理するための)インストルメンタル変数回帰とどのように異なるかについて頭を悩ませようとしています。 サンプル選択は、内生変数が治療される可能性がある内生性の特定の形態であると言うのは正しいですか? また、ヘックマンモデルとIV回帰はどちらも2段階モデル​​であり、最初の段階では治療される可能性を予測しているようです。でもどうやって?

4
勾配ブースティングマシンの精度は、反復回数が増えると低下します
caretR のパッケージを介して勾配ブースティングマシンアルゴリズムを試しています。 小さな大学入学データセットを使用して、次のコードを実行しました。 library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

3
推定
私は次のような理論経済モデルを持っています y=a+b1x1+b2x2+b3x3+uy=a+b1x1+b2x2+b3x3+u y = a + b_1x_1 + b_2x_2 + b_3x_3 + u したがって、理論では、を推定するために、、および因子があると言われています。x1x1x_1x2x2x_2x3x3x_3yyy これで実際のデータが得られたので、、、を推定する必要があります。問題は、実際のデータセットにはとデータのみが含まれていることです。のデータはありません。したがって、実際に適合できるモデルは次のとおりです。b1b1b_1b2b2b_2b3b3b_3x1x1x_1x2x2x_2x3x3x_3 y=a+b1x1+b2x2+uy=a+b1x1+b2x2+uy = a + b_1x_1 + b_2x_2 + u このモデルを推定しても大丈夫ですか? それを推定するものを失いますか? 、推定した場合、項はどこに行くのでしょうか?b1b1b_1b2b2b_2b3x3b3x3b_3x_3 エラー用語で説明されていますか?uuu そして、はおよびと相関していないと仮定したいと思います。x3x3x_3x1x1x_1x2x2x_2

2
楽器と変数の因果関係の方向性は重要ですか?
因果律に関する楽器変数の標準的なスキーム(->)は次のとおりです。 Z -> X -> Y ここで、Zは機器、Xは内生変数、Yは応答です。 次の関係は可能ですか? Z <- X ->Y Z <-> X ->Y も有効ですか? インストゥルメントと変数の間の相関は満たされますが、そのような場合の除外制限はどのように考えることができますか? 注:表記<->は明確ではなく、問題の異なる理解につながる可能性があります。それでも、回答はこの問題を強調し、それを使用して問題の重要な側面を示しています。読むときは、質問のこの部分について注意して進めてください。

1
2SLSとBinary内生変数の整合性
2SLS推定器は、バイナリの内生変数でも一貫していることを読みました(http://www.stata.com/statalist/archive/2004-07/msg00699.html)。最初の段階では、線形モデルの代わりにプロビット治療モデルが実行されます。 1Sステージがプロビットモデルまたはロジットモデルであっても、2SLSが一貫していることを示す正式な証拠はありますか? また、結果もバイナリの場合はどうなりますか?バイナリの結果とバイナリの内因性変数(第1ステージと第2ステージは両方ともバイナリプロビット/ロジットモデル)がある場合、2SLSメソッドを模倣すると一貫性のない推定値が生成されることを理解しています。これに対する正式な証拠はありますか?Wooldridgeの計量経済学の本にはいくつかの議論がありますが、矛盾を示す厳密な証拠はないと思います。 data sim; do i=1 to 500000; iv=rand("normal",0,1); x2=rand("normal",0,1); x3=rand("normal",0,1); lp=0.5+0.8*iv+0.5*x2-0.2*x3; T=rand("bernoulli",exp(lp)/(1+exp(lp))); Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1); output; end; run; ****1st stage: logit model ****; ****get predicted values ****; proc logistic data=sim descending; model T=IV; output out=pred1 pred=p; run; ****2nd stage: ols model with predicted values****; proc reg data=pred1; model y=p; run; …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.