タグ付けされた質問 「econometrics」

計量経済学は、経済学への応用を扱う統計学の分野です。

1
予測モデルの応答変数が異なる場合に予測を組み合わせる方法は?
前書き 予測の組み合わせでは、人気のあるソリューションの1つは、いくつかの情報基準の適用に基づいています。モデルに対して推定された赤池基準を例にとると、からの差を計算でき、RP_j = e ^ {(AIC ^ *-AIC_j)/ 2}は次のように解釈できますモデルjの真の確率。重みは次のように定義されますA ICjあ私CjAIC_jjjjA ICjあ私CjAIC_jA IC∗= 分jA ICjあ私C∗=分jあ私CjAIC^* = \min_j{AIC_j}R Pj= e(A IC∗− A ICj)/ 2RPj=e(あ私C∗−あ私Cj)/2RP_j = e^{(AIC^*-AIC_j)/2}jjj wj= R PjΣjR Pjwj=RPjΣjRPjw_j = \frac{RP_j}{\sum_j RP_j} 問題 私が克服しようとしている問題は、モデルが異なるように変換された応答(内因性)変数で推定されることです。たとえば、一部のモデルは年間成長率に基づいており、別のモデルは四半期ごとの成長率に基づいています。したがって、抽出されたA ICjあ私CjAIC_j値は直接比較できません。 試したソリューション 重要なのはA ICあ私CAICの違いだけなので、応答変数の変換に不変なベースモデルのA ICあ私CAIC(たとえばlm(y~-1)、パラメーターなしでモデルを抽出しようとした)を使用して、jjj番目のモデルとベースモデルA ICあ私CAIC。ただし、ここでは弱点が残っているようです。違いは、応答変数の変換によって影響を受けます。 おわりに 「すべてのモデルを同じ応答変数で推定する」などのオプションは可能ですが、非常に時間がかかります。問題を解決する方法が他にない場合、苦痛な決定に行く前に、迅速な「解決策」を探したいと思います。


4
因果関係の数学的定義
ましょうおよび、ランダムな変数です。の条件付き平均である与えられた。私たちは言う因果に関連していない場合に依存しないそれはに等しい意味し、。さて、因果関係のこの定義に少し触れましょう。反復期待の法則により、です。これは、がに依存しない場合、それが等しい場合、ことを意味します。X E (Y | X )Y X Y X E (Y | X )X E (Y )E (X E (Y | X ))= E (E (X Y | X ))= E (X Y )E (Y | X )X E (Y )YYYXXXE(Y|X)E(Y|X)E(Y|X)YYYXXXYYYXXXE(Y|X)E(Y|X)E(Y|X)XXXE(Y)E(Y)E(Y)E(XE(Y|X))=E(E(XY|X))=E(XY)E(XE(Y|X))=E(E(XY|X))=E(XY)E(XE(Y|X)) = E(E(XY|X)) = E(XY)E(Y|X)E(Y|X)E(Y|X)XXXE(Y)E(Y)E(Y)E(X)E(Y)=E(XY)E(X)E(Y)=E(XY)E(X)E(Y) = E(XY) 言い換えると: とが因果関係がない場合、とは無相関です!-これは意味がなく、私はこれが間違っているに違いないことを知っています。因果関係を誤って定義しましたか?何が悪いのでしょうか?Y X …

1
「ビールとおむつ」の相関分析を行う方法
次と同等のデータがあります。 shopper_1 = ['beer', 'eggs', 'water',...] shopper_2 = ['diapers', 'beer',...] ... このデータセットを分析して、次のような意味を持つ相関行列を取得します。xを購入した場合、yを購入する可能性があります。 Python(またはMATLAB以外の何か)を使用して、どうすればそれを回避できますか?いくつかの基本的なガイドライン、または私がどこを見るべきかへのポインタが役立つでしょう。 ありがとうございました、 編集-私が学んだこと: これらの種類の問題は、相関ルールの発見と呼ばれます。ウィキペディアには、そうするための一般的なアルゴリズムのいくつかをカバーする優れた記事があります。そうするための古典的なアルゴリズムは、Agriraw et alによるAprioriのようです。al。 これにより、Pythonインターフェースのデータマイニングパッケージであるorangeが表示されました。Linuxの場合、インストールする最良の方法は、提供されているsetup.pyを使用してソースからインストールすることです Orangeはデフォルトで、サポートされているいくつかの方法の1つでフォーマットされたファイルから入力を読み取ります。 最後に、単純なアプリオリ相関ルールの学習はオレンジ色で単純です。

2
Silverman(1981)は「クリティカル帯域幅」によって何を意味しましたか?
Kernel Density Estimatorの帯域幅の選択において、私の理解による重要な帯域幅は次のとおりです。 「すべての整数kについて、カーネル密度の推定値が最大でk最大になるような1<k<n最小幅を見つけることができますh(k)。Silvermanはこれらのh(k)値を「クリティカル幅」と呼びます。 私はこの概念を直感的に理解していません。任意の助けいただければ幸いです。 ありがとうございました!

1
DDD(TD、トリプル差分)推定量に関する3つの関連する質問
ジェフウォルドリッジの計量経済分析(第2版)では、州Bが高齢者を対象としたヘルスケアポリシーの変更を実施する2つの期間のケースについて、151ページの「 DDD(difference-in-differences)」推定式の式を導出しています。。 まず、式(6.56)に第4項がない理由に戸惑い (y¯A,N,2−y¯A,N,1),(y¯A,N,2−y¯A,N,1),(\bar y_{A,N,2} - \bar y_{A,N,1}), これは、ポリシーを変更しない州(グループA)の非高齢者(グループN)の平均健康転帰の変更に対応します。 彼はこの方法を使用しているとGruber(1994)を引用していますが、その論文の表3の私の読解は、2つのDDの違いであるため、4番目の項でそれを得る必要があります(そうでない場合、代わりにが得られますちょうど)。δ3+δ0δ3+δ0\delta_3 + \delta_0δ3δ3\delta_3 私はすでに2枚目の印刷の正誤表を確認しましたが、これは表示されなかったので、ここで何か不足しているに違いありません。また、彼の中に表示される2007 NBERの講義ノートと同じ形式で。 2つ目の質問は、期間が3つ以上ある場合、JWは次のような回帰を提案することです。 状態のタイプ(AまたはB)の完全なダミーセット 年齢カテゴリ(EまたはN)のフルセットのダミー すべての期間のダミー 前の3つの間のペアワイズ相互作用 ポリシーの対象となるグループおよび期間に対して1の値を取るポリシーダミー。これは、対象のDDDパラメータです。 JWは「ダミーの完全なセット」と「すべての期間」を書いていますが、ダミー変数トラップに陥らずにそれをどのように行うことができるかはわかりません。タイプAの状態1と非高齢者の状態(グループN)を削除するのは自然に思えるかもしれませんが、期間が10あり、治療は期間5で行われると言います。可変トラップ?この選択はDDDパラメーターとその解釈を変更するようですが、どれが最適かはわかりません。ここだ別の質問のベースラインとして機能し、単一の事前期間がありますので、自然な選択があります。 最後に、単純なDDの一般的な傾向と同様に、DDDを特定する仮定は正確に何ですか?複数の期間でテスト/強化する方法はありますか? Myoung-jae Leeの政策、プログラム、および治療効果に関するミクロ計量経済学では、条件(JWの例に変換)は次のようにリストされています。 δ3+E[u1,2−u0,1|E=1,B=1]−E[u0,2−u0,1|E=1,A=1]−E[u0,2−u0,1|N=1,B=1]−E[u0,2−u0,1|N=−=1,A=1],δ3+E[u1,2−u0,1|E=1,B=1]−E[u0,2−u0,1|E=1,A=1]−E[u0,2−u0,1|N=1,B=1]−E[u0,2−u0,1|N=−=1,A=1], \delta_3 + E[u_{1,2} - u_{0,1}\vert E=1,B=1]-E[u_{0,2} - u_{0,1}\vert E=1,A=1]-{E[u_{0,2} - u_{0,1}\vert N=1,B=1]-E[u_{0,2} - u_{0,1}\vert N=-=1,A=1]}, 最初の添え字は潜在的な結果(1は処理済み、そうでない場合は0)をインデックス付けし、2番目は時間(postは2、preは1)です。私はこれを、他の場所にいる高齢者と比較した治療状態の高齢者の観察不能量の経時変化が類似している限り、非高齢者の同じ量に等しいと解釈すると、DDDは正しい効果を識別します。これは一般的な傾向よりも弱いようです。DDDには十分ですが、必須ではありません。これは正しいです?

1
制御機能アプローチとブートストラップ
のは、私は断面データを持っていると仮定してみましょう上、、(については以下を参照してください、、)。yyyバツ1バツ1x_1バツ2バツ2x_2yyyバツ1バツ1x_1バツ2バツ2x_2 変数と影響と、制御関数アプローチを使用して変数に対するそれらの相互作用()を推定したいのですが、とは内生的である可能性が高いです。と 2つのインストゥルメントがあり。次の2つの第1ステージの方程式を推定し、次の方法で予測残差を保存します。バツ1バツ1x_1バツ2バツ2x_2バツ3= x1∗ x2バツ3=バツ1∗バツ2x_3= x_1*x_2yyyバツ1バツ1x_1バツ2バツ2x_2z1z1z_1z2z2z_2 ivreg2 x1 z1 z2 predict error1hat, residuals ivreg2 x2 z1 z2 predict error2hat, residuals 予測された残差を保存したら、次の方法で第2段階の方程式を推定します。 ivreg2 y x1 x2 x3 error1hat error2hat 、、およびの推定された係数は理にかなっていますが、標準誤差はOKではないことを知っています(http://eml.berkeley.edu/~train/petrintrain.pdfの 8ページを参照)。バツ1バツ1x_1バツ2バツ2x_2バツ3バツ3x_3 http://eml.berkeley.edu/~train/petrintrain.pdfの 8ページで、著者はブートストラップを使用して、、修正された標準エラーを取得することをます。バツ1バツ1x_1バツ2バツ2x_2バツ3バツ3x_3 私の質問は: ブートストラップはどのように設定すればよいですか? ブートストラップは第2段階の方程式にのみ適用されますか、それとも第1段階と第2段階の両方の方程式に適用されますか? ここで、、、およびパネルデータがあるとします。まず、グループ内差異を使用して、観察されていない異質性を削除し、次に、データが断面データであるかのように、制御関数アプローチを使用してパラメーターを推定します(上記を参照)。上記のケースに関してパネルデータを使用する場合、追加の調整を行う必要がありますか?yyyバツ1バツ1x_1バツ2バツ2x_2

3
機器変数の有効性の定義
「楽器の有効性」とはどういう意味ですか? 私の計量経済学コースでは、計測器の有効性をとして定義しましたここで、は計測変数であり、は一変量回帰モデルの誤差項です。次に、楽器の強さについても話しましたが、妥当性とは異なる要件であることを正しく理解できたと思います。Z uE[Z|u]=0E[Z|u]=0E[Z|u]=0ZZZuuu アプリケーションでは、妥当性の定義はとしてよく見られますここで、は計測器であり、は内因性の説明変数であり、(上記のように)、通常は除外制限として定義されます。Z X E [ Z | u ] = 0corr(Z,X)≠0corr(Z,X)≠0{\rm corr}(Z,X) \neq 0ZZZXXXE[Z|u]=0E[Z|u]=0E[Z|u]=0 私は少し混乱していて、必要なIVアプローチの入門書を見つけるのはそれほど簡単ではありません。誰かがこれらの問題を解明することができますか?

4
回帰発展途上国:GDP-GrowthまたはGDP
私の修士論文では、開発途上国が停滞している理由を基本的に知りたいと思います。理論的な側面の次に、回帰も行いたいと思います。国家元首の在任期間、平均余命、労働時間制限、成人の識字率、人口の増加、および5年間のいくつかの(その他の)制度的変数など、多くの独立変数の従属変数としてGDPまたはGDP成長を後退させたいと思います。私の質問は次のとおりです。独立変数でGDP成長(%)を後退させる方が理にかなっていますか、それとも実際のGDP値(たとえば、$)を使用する必要がありますか?

2
セキュリティリターン+ ARIMA / GARCHの質問を予測するために使用できる計量経済モデル
私は学部の論文を書こうとしています。そこでは、特定の金融時系列で特定の計量経済モデルの予測力をテストします。私はこれをどうやってやるべきかについていくつかのアドバイスが必要です。状況を説明するために、私は主に計量経済学を自己学習しています。私がこのテーマに取り組んだ唯一のコースは、時系列モデルを掘り下げる前に止まったので、私はこのテーマの専門家ではありません。 残念なことに、私は最近ARIMAモデルが株価(およびその他のセキュリティ)のリターンを予測するのが非常に悪いことを読みました。私の学校の経済学部の教授もこれを確認しました。この間ずっと、それらがおそらくいくつかの財務時系列の予測にリモートで役立つことを願っていました...私が見ることができる他のモデルはありますか?私の目標は、RまたはMATLABで時系列の計量経済モデリングを学習し、うまくいけば統計的に有意な予測結果を見つけることです。また、あなたが注目する特定の市場(エネルギー、レート、株式)はあ​​りますか? 最後に、GARCHはボラティリティの予測にのみ使用されますか?私が言及した教授は、株価のリターンをモデル化するために、GARCHまたはARIMA-GARCHモデルに目を向けるべきだと示唆しているようです。実際の返品にも使えるかもしれないと思われる論文をいくつか読んだのですが... ARIMA-GARCHモデルのARおよびMAコンポーネントは、ARMAモデルのコンポーネントと異なりますか?私が漠然と理解したことから、ARIMAとGARCHは2つの完全に別のものです(前者は実際の時系列を予測するために使用され、もう一方はその変動性を予測するために使用されます)。 質問が多すぎないことを願っていますが、どこに向かえばよいのかわからないので、私はこれまでずっと自分で研究してきました。どうもありがとう!

4
回帰係数に季節性を許容する方法はありますか?
時系列G tと共変量B tがあるとします。ARMAモデルによってそれらの間の関係を見つけたい: G T = Z T +β 0 +β 1 B T ここで、残差Z tはいくつかのARMAプロセスに従います。 問題がある:私は確かに知っているβ 0及びβ 1年の時間とともに変化します。それでも、月ごとに個別のモデルをあてはめたくありません。これは、時系列に不連続性をもたらすため、最終的な残差の自己相関関数を計算できないためです。 それで、共変量の相関係数を季節的に変化させることができる時系列モデル(またはモデルのファミリー、不思議)はありますか? ======================== 編集:ここに答えてくれてありがとう。季節限定のダミーを使うことにしたのですが、忙しかったので間に合いませんでした。

1
性差別のためのハウスマンテストの使い方は?
スウェーデンの大企業の男女の男女の賃金格差を推定して、性差別の有無をテストしています。Hausmanテストは、個々の固定効果がランダムであるため、プールされたOLSまたはランダム効果に依存することができないというnullを拒否します。問題は、時間の経過とともに変化しないため、女性ダミーを固定効果回帰に維持できないことです。 差別をテストするために代わりにハウスマンテストを使用するよう提案されましたが、これをどのように使用して男性と女性の労働者の収入の差を見つける必要があるのか​​実際にはわかりません。多分ここの誰かがこのアドバイスをもう少しよく理解してくれることを望んでいました。もしそうなら、私にこれについていくつかの光を当ててもらえますか?

2
AngristとImbensのLATE定理の証明1994
内因性変数が結果及ぼす影響を推定するために使用できるバイナリー機器があると仮定します。楽器に有意な第1ステージがあり、ランダムに割り当てられ、除外制限を満たし、Angrist and Imbens(1994)で概説されているように単調性を満たしているとします。 http://www.jstor.org/discover/10.2307/2951620?uid=3738032&uid=2&uid=4&sid=21104754800073ZiZiZ_iDiDiD_iYiYiY_i 彼らは、コンパイラである確率()は およびコンパイラーの部分潜在的な結果の差は CiCiC_iPr(Ci)=Pr(Di=1|Zi=1)−Pr(Di=1−Zi=0)Pr(Ci)=Pr(Di=1|Zi=1)−Pr(Di=1−Zi=0)\text{Pr}(C_i) = \text{Pr}(D_i = 1|Z_i = 1) - \text{Pr}(D_i = 1 - Z_i = 0)E(Yi1−Yi0|Ci)=E(Yi|Zi=1)−E(Yi|Zi=0)E(Di|Zi=1)−E(Di|Zi=0)E(Yi1−Yi0|Ci)=E(Yi|Zi=1)−E(Yi|Zi=0)E(Di|Zi=1)−E(Di|Zi=0)E(Y_{i1} - Y_{i0}|C_i) = \frac{E(Y_i|Z_i=1)-E(Y_i|Z_i=0)}{E(D_i|Z_i=1)-E(D_i|Z_i=0)} 誰かがこれらの2つの表現をどのように取得するか、さらに重要なことにそれらをどのように組み合わせるかについて、誰かがいくつかの光を当てることができますか?私は彼らのジャーナル記事からこれを理解しようとしますが、私はそれを理解することができません。これについて何か助けていただければ幸いです。

1
固定効果による差異の差異
DDモデルに固定効果があることに関して2つの質問があります。 異なる時期に発生する治療を受けています(例:2001、2005など)。DDモデルに適合させたいので、治療年数は年々「0」を治療時間として標準化しています。治療年の不均一性を制御するために、私は真の年の固定効果を含めました。 y私トン= β0+ β1治療+ β2+ βの後3(トリート ⋅ 後)+ η(年固定効果)+ γC私トン+ ϵ私トンyit=β0+β1Treat+β2After+β3(Treat ⋅ After)+η(Year Fixed Effects)+γCit+ϵity_{it} = \beta_0 + \beta_1 \text{Treat} + \beta_2 \text{After} + \beta_3 (\text{Treat $\cdot$ After}) + \eta (\text{Year Fixed Effects})+ \gamma C_{it} + \epsilon_{it} 質問1:このモデルに問題はありますか? 質問2:このDDモデルに時定数の固定効果を含めることに問題はありますか?たとえば、iレベルの固定効果()および/またはi固定効果のグループ指標(たとえば、男性/女性または人種)を含めるとどうなりますか?DDが時定数i-lvl FEをキャンセルすることに気づきましたが、ここに再度含めるとどうなりますか?α私αi\alpha_i

1
パネルデータの仕様
データセットの最適な仕様を見つけようとしています。 説明された変数について、3つの同様のパネルデータモデルで経済成長の意味でポーランドの特別経済区の有効性を調査しようとしています。a)登録失業率b)1人あたりのGDP c)1人あたりの総固定資本形成。データはNUTS3サブリージョン用です。説明変数は次のとおりです年のサブリージョンにSEZが存在する場合は0-1 、いくつかの経済変数。年間の頻度、データセットは66のサブリージョンの2004〜2012です。ttt 固定効果とランダム効果を試しました。今のところ、私は重要性と理論的に正しい兆候があるため、FEを選択しました。しかし、私がそれを当たり前のことと見なすのを妨げるいくつかの問題があります: 自己相関と相互相関をテストする方法は? Stataでエラー項の分布をテストする方法がわかりません。さらに、それが正常に分布していない場合は、あまり気にする必要がありますか? 文献からわかるように、説明変数と-1または1に近い誤差項の間の相関係数の値は、実際には悪くありません。私の場合は、ご覧のとおり、ほぼ-1です。 混合モデルは私のデータセットに適していますか? 失業率を説明するモデルの結果を添付します。 コード: xtreg st_bezr sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2, fe Fixed-effects (within) regression Number of obs = 594 Group variable: id Number of groups = 66 R-sq: within = 0.4427 Obs per group: min = 9 between = 0.3479 avg …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.