計量経済学と他の統計分野との間の主要な哲学的、方法論的、および用語的な違いは何ですか?


70

計量経済学は、従来の統計とかなり重複していますが、多くの場合、さまざまなトピック(「識別」、「外生」など)について独自の専門用語を使用します。私はかつて、用語は異なるが概念は同じであるという別のフィールドのコメントで応用統計の教授を聞いたことがあります。しかし、独自の方法と哲学的区別もあります(ヘックマンの有名なエッセイが思い浮かびます)。

計量経済学と主流の統計学との間にはどのような用語の違いがありますか?また、用語は単なる用語ではなく、どこに分かれて異なるようになりますか?

回答:


96

同じものが異なる分野で異なる名前と呼ばれるいくつかの用語の違いがあります:

  1. 生物統計学の縦断的データは、同じ個人の繰り返しの観察=計量経済学のパネルデータです。
  2. 1の確率が1としてモデル化されるバイナリ従属変数のモデルは、計量経済学ではロジットモデル、生物統計学ではロジスティックモデルと呼ばれます。生物統計学者はオッズ比の点でロジスティック回帰を使用する傾向がありますはしばしばバイナリであるため、オッズ比は母集団の2つのグループにおける関心のある結果の相対頻度を表します。これは一般的な解釈であるため、この解釈を容易にするために、連続変数が2つのカテゴリ(低血圧と高血圧)に変換されることがよくあります。1/(1+exp[xβ])x
  3. 統計学者の「推定方程式」は、計量経済学者の「モーメント条件」です。統計学者の推定値は、計量経済学者の極値推定量です。M

同じ用語が異なる分野で異なることを意味するために使用される用語の違いがあります。

  1. 固定効果は、ANOVA統計学者の回帰方程式のを表し、計量経済学者の「内」の推定量を表します。xβ
  2. 堅牢な推論とは、経済学者向けの不均一分散修正標準誤差(クラスター化標準誤差および/または自己相関修正標準誤差への拡張を含む)および統計学者にとってはるかに外れ値に対して堅牢な方法を意味します。
  3. エコノミストは、層別化されたサンプルは、選択の確率が観測ごとに異なるものであるというとんでもない考えを持っているようです。これらは不等確率サンプルと呼ばれるべきです。層別化されたサンプルとは、サンプリングが行われる前に既知の特性に従って母集団が事前定義されたグループに分割されるサンプルです。
  4. 計量経済学者の「データマイニング」(少なくとも1980年代の文献では)は、ハレルの本で見事に説明されている複数のテストとそれに関連する落とし穴を意味していました。コンピューター科学者(および統計学者)のデータマイニング手順は、データのパターンを見つけるノンパラメトリックな方法であり、統計学習とも呼ばれます

計量経済学のユニークな貢献は

  1. mpiktasが別の回答で説明したように、内生性と不十分に指定された回帰モデルに対処する方法は、(i)説明変数自体がランダムである可能性があることを認識します(したがって、パラメーター推定値にバイアスを生じさせる回帰誤差と相関します)。モデルは省略された変数の影響を受ける可能性があります(これはエラー項の一部になります)。Angrist&Pischkeはこれらの問題の素晴らしいレビューであり、統計学者はそこから回帰分析を行う方法について多くを学びます。少なくとも、統計学者は機器変数の回帰を学び、理解する必要があります。
  2. より一般的には、エコノミストは、自分のモデルが多変量正規性と同じくらいばかげたことに左右されないように、モデルについて可能な限り少ない仮定をしたいと考えています。そのため、GMMは経済学者に非常に人気があり、統計に追い付くことはありません(1960年代後半にファーガソンによって最小記述されていたとしても)。そのため、計量経済学では経験的尤度の採用が指数関数的に増加しましたが、統計ではわずかに続いています。そのため、エコノミストは、デフォルトのOLS標準誤差を使用して、「頑健な」標準誤差と統計学者で回帰を実行します。S 2X ' X - 1χ2s2(XX)1
  3. 定期的に間隔を空けたプロセスを使用して、時間領域で多くの作業が行われました。これがマクロ経済データの収集方法です。ユニークな貢献には、統合された統合プロセスと自己回帰条件付き不均一分散((G)ARCH)メソッドが含まれます。一般的には小柄な人間なので、私はこれらにあまり詳しくありません。

全体的に、経済学者は彼らのモデルの係数の強力な解釈を探す傾向があります。統計学者は、ロジスティックモデルを肯定的な結果の確率を得るための方法として、多くの場合単純な予測デバイスとして採用し、また、判別分析との関連だけでなく、それが所有する優れた指数ファミリプロパティを備えたGLM解釈に注意する場合があります。エコノミストは、ロジットモデルの効用解釈について考え、このモデルではのみが識別され、不均一分散性がそれをスローオフできることを懸念します。(統計学者は、σβ/σσ もちろん、経済学者は話している。)もちろん、入力が線形であるユーティリティは、Microeconomics 101の観点からは非常におもしろいことですが、半凹関数の一般化はおそらくMas-Collelで行われます。

経済学者は一般に見逃しがちですが、IMHOの恩恵を受けるのは、多変量解析の側面です(測定誤差と複数のプロキシを処理する方法としての潜在変数モデルを含みます... 、回帰診断(これらすべてのCookの距離、MallowsのCp、DFBETAなど)、欠落データの分析(Manskiの部分的な識別は確かに派手ですが、主流のMCAR / MAR / NMAR内訳と多重代入がより有用です)、および調査統計。主流の統計からの他の多くの貢献は、計量経済学によって楽しまれ、標準的な方法論として採用されるか、短期的な方法として渡されます:1960年代のARMAモデルは、一部の大学院プログラムとして、統計学よりも計量経済学でおそらくよく知られています最近の統計では、時系列コースを提供できない場合があります。1970年代の収縮推定量/リッジ回帰は、消え去りました。1980年代のブートストラップは、複雑な状況に対する不意の反応ですが、エコノミストはブートストラップの制限をよりよく認識する必要があります; 1990年代の経験的可能性は、理論統計学者よりも理論計量経済学者の方がより多くの方法論の発展を見てきました。2000年代の計算ベイジアン手法は計量経済学で楽しまれていますが、私が感じているのは、前述のロバスト性パラダイムと互換性があるには、あまりにもパラメトリックであり、モデルベースが多すぎるということです。経済学者が統計学習/バイオインフォマティクスの使用を見つけるか、現代の統計で非常に熱い時空のものを見つけるかどうかは、公然の呼び出しです。


14
+1これは、質問が多様なコミュニティに開かれたときに素晴らしい答えが得られることの素晴らしい例です。
whuber

1
@whuber、コメントありがとう。率直な分裂は、率直に言って、私を夢中にさせます。
StasK

@StasKすばらしい答え。ただし、簡単な点が1つあります。「全体的に、エコノミストはモデルの係数の強力な解釈を探す傾向があります。」厳密に言えば、VAR分析(これは非常に一般的であるため、「全体」の観点から言うべきではありません)では、中心点はモデルの係数を解釈するのではなく、インパルス応答関数を解釈することにあります(多くの場合、 、解釈が複雑すぎるため)。
グレームウォルシュ

@GraemeWalsh-私が言ったように、私はマクロ/時系列で働いていません。これを指摘してくれてありがとう。
StasK

20

それは計量経済学の主要なツールであるため、線形回帰の観点から説明するのが最善です。線形回帰ではモデルがあります:

Y=Xβ+ε

他の統計フィールドと計量経済学の主な違いは、は他のフィールドでは固定として扱われ、計量経済学では確率変数として扱われることです。この違いを調整するために使用しなければならない余分な注意は、異なる専門用語と異なる方法を生み出します。一般に、計量経済学で使用されるすべてのメソッドは、説明変数のランダム性を調整した他の統計フィールドと同じメソッドであると言えます。注目すべき例外はGMMであり、これは独自の計量経済学ツールです。X

違いを見る別の方法は、他の統計フィールドのデータをiidサンプルと見なすことができることです。計量経済学では、多くの場合のデータは確率過程からのサンプルであり、その中のiidは特別な場合にすぎません。したがって、再び異なる専門用語。

通常、上記を知っていれば、他の統計フィールドから計量経済学に簡単にジャンプできます。通常はモデルが与えられるため、何が何であるかを把握するのは難しくありません。私個人の意見では、機械学習と古典統計の専門用語の違いは、計量経済学と古典統計の違いよりもはるかに大きいです。

ただし、計量経済学のない統計には複雑な意味を持つ用語があります。主な例は、固定効果とランダム効果です。これらの用語に関するウィキペディアの記事は混乱し、計量経済学と統計を混ぜています。


5
「主要な例は、固定効果とランダム効果です。これらの用語に関するウィキペディアの記事は、計量経済学と統計を混ぜた混乱です。」仰るとおり。
マイケルビショップ

8

微妙な違いの1つは、エコノミストがモデルのエラー用語に意味を帰することがあることです。これは、関心または個々の異質性を表す構造パラメーターを推定できると考えている「構造」経済学者の間で特に当てはまります。

このクラスの例はプロビットです。統計学者は一般にエラー用語の原因については不可知論者ですが、エコノミストは回帰のエラー用語を選好の不均一性を表すものとしてしばしば見ます。プロビットのケースでは、女性が労働力に参加する決定をモデル化できます。これはさまざまな変数によって決定されますが、エラー用語は、仕事に対する個々の好みが変化する可能性のある観察されない程度を表します。


4
統計学者はエラー用語の原因については不可知論者かもしれませんが、それは彼らがそれを気にしないという意味ではありません。あなたが説明しているのは、誤差項の不均一性です。つまり、誤差項に関する通常の仮定が満たされていません。統計学者はそれを無視しません。
mpiktas

2
興味深いことに、この場合、エラー用語の形式に問題はありません。統計学者も経済学者も同様に、腕を組み、異分散性やその他の非iidエラー条件について心配するでしょう。ただし、プロビットのようにエラー項がN(0,1)であっても、エコノミストはそれに経済的な解釈を与える傾向があります。
d_a_c321

5
これは一般的なモデリングに適用されます。あなたの特別な方法でモデルを解釈することは、私の経験からすれば、エコノミストに限定されません。
mpiktas

同意しません。エコノミストは、モデルの巧妙な解釈を明らかに独占しています<冗談です!>。良い点。
d_a_c321

8

もちろん、幅広い声明は過度に広範になります。しかし、私の経験では、計量経済学は因果関係を懸念しており、統計は予測により関心を持っています。

経済学の面では、「信頼性革命」の文献(ほとんど無害な計量経済学など)を避けることはできません。エコノミストは、政策評価と推奨に目を向けて、何らかの結果が何らかの治療に与える影響に焦点を当てています。

統計面では、注目すべき例であるオンライン分析と遺伝学へのアプリケーションを使用したデータマイニング/機械学習の台頭が見られます。ここでは、研究者は行動や関係を正確に説明するよりも予測することに関心があります。彼らは原因ではなくパターンを探します。

また、統計学者は伝統的に実験デザインに興味があり、1930年代の農業実験に戻ったことに言及します。


7

私は、主流の統計科学と呼ばれるものと比較して、計量経済学者は、図式またはデータベースに基づくグラフの使用に消極的であることに気づきました。当然ながら、他の場所よりも計量経済学の中心である回帰の範囲は、重要なケースです。統計学者による回帰の最新の紹介では、診断プロットを含むデータのプロットと回帰の結果のプロットの価値全体を強調していますが、計量経済学のテキストの扱いは明らかに形式的です。計量経済学の主要なテキストには多くのグラフが含まれておらず、それらの価値を強く宣伝していません。

これを分析することは、外交的またはそれ以上のように見えるリスクなしに分析することは困難ですが、寄与として以下のいくつかの組み合わせを推測します。

  1. 厳格さを求める。計量経済学者は、データから学ぶことに疑念を抱いたり、敵意を抱く傾向があり、正式なテストに基づいた決定を強く望みます(定理から出ていない場合はいつでも)。これは、モデルが「理論」に基づいていることへの選好にリンクしています(ただし、これは、データについて話さないエコノミストによって、予測子が以前に論文で言及されたことを意味する場合があります)。

  2. 出版慣行。経済学または計量経済学の論文は、係数、標準誤差、t統計量、およびP値の高度に様式化された表があり、重いです。グラフを追加することは多くの場合考慮されていないようであり、提供された場合はレビュアーによるカットのために提案される可能性があります。これらの慣行は、重要性レベルの主演などに関する厳格な慣習により、自動化される程度まで、1世代以上にわたって組み込まれています。

  3. 複雑なモデルのグラフィックス。暗黙のグラフは、多くの予測子などを含む複雑なモデルに一致するグラフがあるように見えない場合は無視されます(実際に決定するのは難しい場合が多い)。

当然のことながら、私が提案しているのは平均的な手段の違いであり、どちらの場合にも大きなばらつきがあることを認識しています。


4

他のほとんどの定量的分野とは異なり、経済学はMARGINでの事柄を扱います。つまり、限界効用、限界代替率などです。微積分学では、経済学は「一次」(および高次のデリバティブ)を扱います。

多くの統計学分野では、平均や分散などの非微分量を扱います。もちろん、限界および条件付き確率分布の領域に入ることができますが、これらのアプリケーションのいくつかは経済学にも行きます(「期待値」など)。


2

それは計量経済学ではなく、文脈です。尤度関数に一意の最適値がない場合、統計学者と計量経済学者の両方に関係します。ここで、経済理論から得られ、パラメータが特定されるようにパラメータ化を制限する仮定を提案する場合、それは計量経済学と呼ばれるかもしれませんが、仮定はあらゆる実質的な分野から来た可能性があります。

外生は哲学的な問題です。異なる見解の比較については、たとえばhttp://andrewgelman.com/2009/07/disputes_about/を参照してください。経済学者は通常、Rubinのように理解しています。

要するに、教師が使用する専門用語を採用するか、心を開いて広く読んでください。


2

計量経済学者はほとんど専ら因果推論に興味を持っていますが、統計学者は結果を予測するモデルも使用します。その結果、計量経済学者は外生にもっと焦点を当てています(他の人が述べたように)。縮約型計量経済学者と構造計量経済学者は、この因果解釈をさまざまな方法で理解します。

縮約型の計量経済学者は、機器変数手法を使用して外生を頻繁に処理します(IVは統計学者によって使用される頻度ははるかに低いです)。

構造計量経済学者は、統計学者の仕事ではまれな理論の量に依存することにより、パラメーターの因果解釈を得る。


1
IVは非統計学者によって多く使用され、簡約形式の計量経済学は、IV以外の因果推論のための多くの技術(diff-in-diff、回帰の不連続性など)を使用します。計量経済学IVと最近の非計量経済統計IV開発との調整については、Imbensによるこの論文を参照してください。
アリB.フリードマン14年

2

統計学者として、私はこれをより一般的な用語で考えます。生体認証と計量経済学があります。これらは両方とも統計を使用して問題を解決する領域です。計量経済学は経済学を扱うのに対して、生物計量学では生物学的/医学的問題を扱っています。そうでなければ、異なる分野が異なる統計的手法を強調することを除いて、それらは同じです。生体認証では、生存分析と分割表分析が頻繁に使用されます。計量経済学では時系列が頻繁に使用されます。回帰分析は両方に共通です。経済学と生物統計学の用語の違いについての回答を見たところ、実際の質問は主に用語に関するものであり、実際には他の2つだけを取り上げたようです。答えはとても良いので、何も追加できません。特にStasKの回答が気に入りました。しかし、生物統計学者として、私はロジットモデルとロジスティックモデルを同じ意味で使用していると思います。log(p / [1-p])をロジット変換と呼びます。


2
(+1)ドメイン固有の問題に適用される統計のドメイン固有のアプリケーションのリストにサイコメトリックスを追加できます。
アンディW
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.