原因の特定とペナルティ付きスプライン


8

私は経済学のジャーナルから拒絶されました。拒否の理由としては、次のものが挙げられます。

因果関係を明確に識別する代替のより単純な手法と比較して、セミパラメトリック法を使用することの利点は明確には発揮されません

OLSに固執する多くのエコノミストに方法論を動機付けるより良い仕事をしたかもしれないことは確かに可能です。しかし、私は「クリーンな識別」に違反しましたか?ご自身で判断して、ご意見をお聞かせください。

私の主な推定式は Zは連続で、XTはバイナリです。私は当然のことながら E [

yit=αi+β1Tit+f(ZitZit×TitZit×Tit×Xt)+β2Xt+ϵit
ZXT つまり、 Tの係数は、個々のレベルのダミー変数(計量経済学における「固定効果」)を条件として不偏であることを意味します。連続変数 Zを含めると、 Zの勾配に対する推定処理効果の不均一性がわかります。治療の平均因果効果ので Tはの平均値である β 1 + F Z × Tの様々なレベルのために Z Iが観測こと。
E[ϵ|α,T]=0
TZZTβ^1+f^Z×TZ

y=β0+Xβ+1p(Zp)γ+j=1#varsk=1#knotsjδjk((Zjκjk)p×(Zj>κjk))+ϵ

[β^γ^δ^]=(CC+λ2pD)1Cy

Cλ

もちろん、根拠のない関数形式をデータに課したくないので、これらのセミパラメトリックを使用します。これを行うと、自然に私の推定値にバイアスがかかりますが、正弦関数に対数近似を課すと、私の推定値にバイアスがかかります。しかし、私がそれらを説明したようにペナルティ付きスプラインに固有の何かが本質的に次のステートメントを真実にしないでしょうか?

E[β^1]=β1 iff E[ϵ|α,T]=0

2
私はあなたの最後の質問に答える資格はありません(疑わしいように見えます)が、おそらくJournalsの懸念に対処するために、OLSモデルを論文に含めて、いくつかの指標によってパフォーマンスが悪いことを示す必要がありますか?
thebigdog 2013年

「クリーンな身元確認」に違反していない。セミパラメトリックモデルをクリーンな識別を実現する能力が低下させる固有のものはありません。実際、モデルには線形モデルが含まれています。

@generic_userこれまでに解決策を受け取ったことがありますか?もしそうなら、あなたの質問に答えることができますか?そうでない場合、明確な識別の定義を提供できますか?私は、このケースに関係があるかもしれないしそうでないかもしれない、スプライン調整された分析の公開についていくつかの見方をしています。
AdamO 2017

パーティーには遅れますが、ここで間違ったことを心配していると思います。参考文献は、それらが有用であることを証明せずに複雑さを追加したことを彼らが気に入らないと言っています。シンプルなメソッドの失敗モードを示す例は、導入する複雑さの動機付けに役立ちます。因果関係を適切に特定するためにスプラインが必要な場所を設計する(または実際の例をさらに見つけることができる)必要があります。
ポール

これが何かの点で発表された場合、論文の名前を教えていただけますか?興味深いアプリケーションのようです。
usεr11852

回答:


1

回帰パラメータの「クリーンな識別」は確立された概念ではありません。私がこれによってレビュアーが意味することは、解釈可能でテスト可能な低次元のパラメーターを指定する必要があるということであり、分析を検出するためにきちんと機能しており、偏りのない見積もりが比較的良い効率で得られるようになっています。

「明確な識別」に対する欲求は、OLSがその仕事に適した唯一のツールであることを意味するものではありません。ただし、OLSは、さまざまな設定でパラメータを指定および推定するための理論的かつ実用的なツールです。「明確な識別」に対する欲求は、セミパラメトリックな推論も排除しません。注意として、スプラインは、(a)共変量の複雑な表現を作成することにより、OLSモデルを拡張します。セミパラメトリック推論には、補助統計の影響を排除するための柔軟なモデリングが含まれますが、モデルでは、主な露出はそのような方法で処理されているようです。

レビューアは2つの根拠のある懸念を提起していると思います。まず、罰則の根拠です。ペナルティ付き回帰法は予測に役立つ。それらが推論に使用されることはほとんどありません。リッジ回帰のようなペナルティ付きの方法にはバイアスがかかり、バイアスを説明または評価することは困難です。AICを最小化する目的は、有効な推論ではなく、最良の予測を得ることです。2番目に実証された懸念事項は、メインの露出をモデル化するためにスプラインが必要かどうかです。スプラインは複雑な非線形関数形をモデル化できると言うのは事実です。ただし、スプラインはほとんど単純化されません。これは複雑な高次元の表現であり、ノットポイントとチューニングが研究者のバイアスの原因となる可能性があり、共変量は高度に訓練された統計学者を除いてだれにとってもほとんど解釈不可能です。スプラインによって正確にモデル化された多くの統計的に有意な傾向には、統計的にも実質的にも重要でない線形近似があります。

主な露出の関数形式が誤って指定されている場合、Huber White標準誤差を使用して、非線形トレンドの1次近似として最小二乗勾配の一貫した偏りのない推論を取得できます。データに複雑な設計がある場合、スプラインを使用して、推論の基にしない精度変数をモデル化できます。これは、データに複雑な異質性がある場合に、ばらつきを効果的に一致させ、減らすのに役立ちます。

レビュアーのコメントは、露出の線形モデルをフィッティングし、Huber White Sandwichエラーで推論を行うことで対処できると思います。推論がスプライン推論とほぼ一致する場合は、露出と応答の間の曲線傾向を示している限り、スプラインモデルについてコメントします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.