まず最初に。私が言うすべては私の理解だけです。したがって、いつものように、私は間違っている可能性があります。
ヘンリーは部分的に正しいです。しかし、計量経済学もメソッドのファミリーです。提供されているデータ(断面データとパネルデータなど)だけでなく、目前の研究課題に応じて、さまざまな計量経済学的手法を適用できます。
私が理解している機械学習は、機械が過去の観測からパターンを学習できるようにする方法のコレクションです(多くの場合、ブラックボックスで)。回帰は、変数間の関係を学習し、これらの関係を将来に推定できるため、計量経済学と機械学習の標準ツールです。
すべての計量経済学者がパラメーター推定の因果解釈に関心があるわけではありません(観測データ(非実験)が使用されている場合、因果解釈を主張することはめったにありません)。多くの場合、時系列データの場合と同様に、計量経済学者も予測パフォーマンスのみを考慮します。
本質的にはどちらも同じものですが、異なるサブフィールドで開発されています(機械学習はコンピューターサイエンスに根ざしています)。どちらもメソッドのコレクションです。計量経済学者は、決定木やニューラルネットワークなどの機械学習手法もますます使用しています。
あなたはすでに非常に興味深い点、因果関係に触れました。基本的に、両方のフィールドは真の根本的な関係を知りたいと思っていますが、すでに述べたように、多くの場合、予測パフォーマンスは機械学習タスクで使用される主要なKPIです。つまり、一般化誤差を低くすることが主な目標です。もちろん、真の因果関係がわかっている場合は、考えられるすべての定式化の中で最も一般化誤差が低いはずです。現実は非常に複雑であり、自由な予感はありません。したがって、ほとんどの場合、基盤となるシステムについての部分的な知識しかなく、時には最も重要な影響を測定することさえできません。しかし、測定したい真の基礎となる変数と相関するプロキシ変数を使用できます。
長い話は短く、非常に表面的なものです。両方の分野が関連していますが、計量経済学者は真の因果関係を見つけること(つまり、いくつかの仮説をテストすること)に主に関心がありますが、機械学習はコンピュータサイエンスに根ざしており、低汎化エラー。
PS:計量経済学でデータセット全体だけを使用することも、一般的に避けられるべきです。計量経済学者は、サンプルで見つかった関係が必ずしも新しいデータに一般化されているわけではないことを認識し始めています。したがって、計量経済学研究の複製は非常に重要です。
これが何らかの形で役立つことを願っています。