原因分析にLASSOを使用することの長所と短所は何ですか?


8

統計学習とその結果は現在、社会科学に広まっています。数か月前、グイド・インベンス氏は次のように述べています。

私は機械学習を少し勉強しましたが、その主な目標は予測であることを知っています。レオ・ブライマンの統計の2つの文化の違いにも同意します。したがって、私の見解では、因果関係はある程度予測に反対しています。

科学は通常因果関係を特定して理解しようとすることを考えると、機械学習はこの目標に役立ちますか?特に、因果分析におけるLASSOの利点は何ですか?

これらの質問に対処する研究者(および論文)はいますか?


2
まあ、OLSは因果効果の推定値を頻繁に生成しないため、LASSOがOLSを置き換える場合、因果関係を発見する「負担」はありません。とはいえ
Christoph

私にとって、ここでのより自然な区別は、ブライマンの区別ではなくShmueli(「説明するか予測するか」、2010)によるものですが、おそらくブレイマンの区別も問題ありません。
Richard Hardy

@ChristophHanck。まあ、あなたは正しいです。しかし、要点は、因果効果を推定するためにOLSが多く使用されてきたことです。たとえば、「ほとんど無害な計量経済学」は、これに関連するいくつかの主題を扱います。したがって、OLSで可能な場合は、なぜLASSOを使用しないのですか?とにかく、参考にしていただきありがとうございます。
ギルヘルムドゥアルテ

@RichardHardyあなたは完全に正しいです。私はこの論文を知っています。説明した方が簡単だと思ったので、ブレイマンについて説明しました。
ギルヘルメドゥアルテ

2
私はそこには同意しません。OLSを使用してカジュアルな効果を推定できる場合、投げ縄も適用できない理由がわかりません
Christoph Hanck

回答:


2

私はそれらすべてを知っているわけではないので、きっと、このwikiスタイルを実行しても気にならないことを願っています。

しかし重要なことの1つは、LASSOがバイアスされていることです(出典、Wasserman氏、講義、申し訳ありません)。これは予測では受け入れられますが、因果推論の問題です。因果関係が必要な場合は、おそらくサイエンスで使用する必要があるため、最も有用なパラメーター(奇妙によく予測される)を推定するだけでなく、TRUE(!)パラメーターを推定します。


いい答えです!実際にバイアスがある場合、因果関係の推定には大きな問題です。しかし、おそらくLASSOは、因果関係を評価するためのより完全な手順で予備的に使用することができます。
ギルヘルムドゥアルテ

たぶん!私は他の人のチャイムを持っていることを熱望していた理由です。
one_observation

@GuilhermeDuarte、それはバイアスではなく、重要な全体的なエラーです。二乗損失では、MSEが重要であり、これはバイアス +分散と等しくなります。Lassoは、ある程度のバイアスにもかかわらずMSEが比較的小さい場合に優れたトレードオフを提供する可能性があるため、MSEが高い場合の公平な推定よりも因果分析に役立つはずです。投げ縄の実際の問題は、投げ縄の信頼区間を取得することが難しいことです。現在それは活発な研究分野です。2
Richard Hardy

@RichardHardy申し訳ありませんが、因果関係を気にするときは、バイアスを気にする必要はありませんが、MSEを使用しますか?これは私には完全に明確ではありません
ギルヘルムドゥアルテ

1
@GuilhermeDuarteは、予測と同様に、因果関係でモデル係数の正確な推定が必要です。精度は、絶対誤差、二乗誤差などで測定できますが、バイアスでは測定できません。たとえば、バイアスが低く、推定誤差が大きい場合があります。したがって、バイアスを見ると、あなたはうまくやっていると思いますが、推定誤差(絶対、二乗など)が高いため、それは誤解を招くでしょう。因果推論における効果の大きさ、統計的有意性などを考慮するときに問題となるのは、推定誤差であり、バイアスではありません。
Richard Hardy
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.