計量経済学と機械学習の違いは何ですか?


8

私の理解では、計量経済学は、部分的(推定ceteris paribus主に推定する目的で)相関関係を因果関係を。そのため、通常は使用可能なデータセット全体を使用します。計量経済学は、パラメトリックとノンパラメトリックにすることができます。

一方、機械学習は因果関係には関心がなく、主に予測を生成することを目的とした「適合」に関心があります。そのため、通常はデータセットをトレーニングセットと予測セットに分割します。機械学習は、パラメトリックおよびノンパラメトリックにすることもできます。


これが私がこれらの2つの分野の中核を成すことができるものですが、私はそれにもっとたくさんあると確信しています。私は主にそれらの違いに興味があります。誰かがこれについての良いガイドを提供できますか?


8
機械学習は方法のファミリーであるのに対し、計量経済学は主題または専門分野であると思います。計量経済学やその他の主題分野で機械学習を使用でき、計量経済学で他の方法を使用できます
Henry

4
ラグナルフリッシュは、Econometricaの最初の号で、econometricsは「統計学と数学との関係における経済理論」について書いています。したがって、計量経済学モデルは、データに当てはめる前に、経済理論または数学/ゲーム理論からしばしば得られます。ただし、統計と機械学習はデータ駆動型であり、理論駆動型ではありません。私の意見では、これが最も重要な違いです。また、計量経済学では、予測モデル(説明モデルとは対照的)または柔軟なモデル(トレーニング/検証が必要)もあります。しかし、それらは使用されるメソッドの一部にすぎません。
Achim Zeileis 2017

1
バナナと果物の違いは何ですか?計量経済学は機械学習のサブフィールドです...
Antoine

3
@Antoine機械学習は計量経済学のサブフィールドであると主張したいのですが...
rbm 2017

4
@Antoineあなたは本気にすることはできません。私は、「機械学習」自体をラベルされた本の中で統計的検定の問題は見たことがない
tomka

回答:


4

まず最初に。私が言うすべては私の理解だけです。したがって、いつものように、私は間違っている可能性があります。

ヘンリーは部分的に正しいです。しかし、計量経済学もメソッドのファミリーです。提供されているデータ(断面データとパネルデータなど)だけでなく、目前の研究課題に応じて、さまざまな計量経済学的手法を適用できます。

私が理解している機械学習は、機械が過去の観測からパターンを学習できるようにする方法のコレクションです(多くの場合、ブラックボックスで)。回帰は、変数間の関係を学習し、これらの関係を将来に推定できるため、計量経済学と機械学習の標準ツールです。

すべての計量経済学者がパラメーター推定の因果解釈に関心があるわけではありません(観測データ(非実験)が使用されている場合、因果解釈を主張することはめったにありません)。多くの場合、時系列データの場合と同様に、計量経済学者も予測パフォーマンスのみを考慮します。

本質的にはどちらも同じものですが、異なるサブフィールドで開発されています(機械学習はコンピューターサイエンスに根ざしています)。どちらもメソッドのコレクションです。計量経済学者は、決定木やニューラルネットワークなどの機械学習手法もますます使用しています。

あなたはすでに非常に興味深い点、因果関係に触れました。基本的に、両方のフィールドは真の根本的な関係を知りたいと思っていますが、すでに述べたように、多くの場合、予測パフォーマンスは機械学習タスクで使用される主要なKPIです。つまり、一般化誤差を低くすることが主な目標です。もちろん、真の因果関係がわかっている場合は、考えられるすべての定式化の中で最も一般化誤差が低いはずです。現実は非常に複雑であり、自由な予感はありません。したがって、ほとんどの場合、基盤となるシステムについての部分的な知識しかなく、時には最も重要な影響を測定することさえできません。しかし、測定したい真の基礎となる変数と相関するプロキシ変数を使用できます。

長い話は短く、非常に表面的なものです。両方の分野が関連していますが、計量経済学者は真の因果関係を見つけること(つまり、いくつかの仮説をテストすること)に主に関心がありますが、機械学習はコンピュータサイエンスに根ざしており、低汎化エラー。

PS:計量経済学でデータセット全体だけを使用することも、一般的に避けられるべきです。計量経済学者は、サンプルで見つかった関係が必ずしも新しいデータに一般化されているわけではないことを認識し始めています。したがって、計量経済学研究の複製は非常に重要です。

これが何らかの形で役立つことを願っています。


Achimのコメントによると、MLは理論上はほとんど(またはまったく)駆動されませんが、それはあなたの言うことではありません。これを拡張できますか?それはおそらく分析の中心的な要素です。
luchonacho 2017

@luchonachoこれはこの回答に関する私のノートで対処されています
tomka '

@luchonacho tomkaはそこで非常に良い点を作りました。それでも、両方の分野が因果関係に関心を持っているべきであり関心があるという事実(およびtomkaもこれについてはすでに言及しています)を強調したいと思います。機械学習の用語では:真の因果関係を知ると、バイアスだけでなく分散も最も低いモデルになるはずです。あらゆる機械学習の応用における本当に重要なステップは、フィーチャーフィーチャーエンジニアリングのステップであり、これは、あなたがどの分野から来たかに関係なく、理論によって推進されるべきです。
JustMe 2017

追加する小さなこと(あなたがpsの前の段落で触れたもの):バイアスがどこにあるかについての懸念の違い。MLでは、モデルのバイアスに対する懸念(例:rmse)。計量経済学では、関心のあるパラメーターのバイアスに対する懸念と、省略された変数のバイアスの可能性。もちろん、一般的に言えば。
paqmo 2018年

2

@JustMeに加えていくつかのメモ:

第一に、計量経済学と機械学習の両面で傲慢さがたくさんあります。2つのうちどちらが無益であるサブ分野である可能性があるかについて話し合います。実際、これらは両方とも統計学分野の強く重複する分野です(これは応用数学として最もよく説明されています)。どちらにも独自の焦点と設定があります。たとえば、計量経済学は、多くの場合、小さいサンプルでの推定とテストの仮説に焦点を当てていますが、MLは、多くの場合、巨大なサンプルでの最良の関数近似に焦点を当てています。1つ目は、分布の仮定を行うパラメトリック手法に焦点を当て、2つ目は、非パラメトリックな分布のない手法に頻繁に(ただし、これに限定されない)焦点を当てています。等々。

第2に、目標が予測である場合、同じ母集団からのランダムなサンプルが利用可能である限り、因果関係を理解する必要はありません。ただし、因果関係を理解することは、システムを理解する(つまり、理論の開発/テスト)、またはシステムを変更する(つまり、介入によって理論に基づいて行動する)場合に中心的な関心事です。このタイプの研究目標は、機械学習よりも計量経済学(および生物統計学のような他の分野)ではるかに一般的です。

ただし、因果関係に関心のある機械学習の研究者もいます。ここでも、フィールド間の主な違いは、計量経済学者が介入について仮説を立て、その影響を推定しようとすることです(たとえば、重み付け、マッチング、選択モデルなどの因果推論理論の手法を使用した観測データまたは実験データから)。むしろ、データから因果関係を学習しようとし(たとえば、有向非循環因果グラフの検索アルゴリズムを使用して)、焦点は単一の介入にあまり強く置かれません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.