リグレッサの条件付けと修正済みとして扱うことの違いは何ですか?


9

時々、リグレッサは固定されている、すなわち非確率的であると仮定します。それは私たちのすべての予測因子、パラメーター推定値などが無条件であることを意味すると思いますよね?私は、それらがもはやランダム変数ではないほど遠くまで行くかもしれませんか?

一方、経済学のほとんどのリグレッサは確率的であると私たちが受け入れる場合、外部の力が何らかの実験を考慮してそれらを決定しなかったためです。その後、計量経済学者はこれらの確率論的リグレッサを条件付けます。

これを修正済みとして扱うのとどう違うのですか?

私は条件付けが何であるかを理解しています。数学的には、それは我々が上のすべての観測と推論条件付きにする意味その説明変数の特定のセットを、私たちは私たちの説明変数(ようになっているの異なる実現を見ていた推論、パラメータ推定値、分散推定値などが同じであったであろうことを言っても野心を持っていません時系列の要点。各時系列は一度だけ表示されます)。

ただし、固定リグレッサと確率リグレッサの条件付けの違いを本当に理解するために、ここで誰かが、固定リグレッサなどに有効であるが確率的であるときに故障する推定または推論手順の例を知っているかどうか疑問に思っています(そして条件付けられる)。

それらの例を楽しみにしています!


2
変数内エラーモデルに精通していますか?
robin.datadrivers 2015

ちょっと@ robin.datadriversいいえ、私は実際には違います。
Hirek

1
これらは、独立変数の測定誤差の推定を調整するために特別に設計されたモデルです。確率的リグレッサとはまったく異なりますが、調べるのに役立ちます。また、一般的に調査研究では、調査によって収集された独立変数にサンプリングエラーがあると想定していることがよくあります。
robin.datadrivers 2015

1
私が遭遇した別の考えは、ベイジアンモデルを使用することでした。ベイジアンモデルは、回帰変数に事前分布を指定することにより、回帰変数をランダムに処理できます。通常、固定として扱われる場合は、パラメーター(係数、平均、分散)に対してのみ事前分布を指定しますが、共変量または結果が欠落している場合は、それらの事前分布を指定します。考えずに実装する方法は正確にはわかりませんが、独立変数ごとに事前分布を指定する方法があるかもしれません。
robin.datadrivers 2015

回答:


3

ここで私は薄い氷の上にいますが、試してみましょう:統計と計量経済学の主な違いは、統計では回帰変数は固定されていると考えがちなので、用語のデザインマトリックスは明らかに実験の計画。ここでは、最初に説明変数を選択して修正すること想定しています。

しかし、ほとんどのデータセット、ほとんどの状況では、これは適切ではありません。私たちは実際に説明変数を観察しており、その意味でそれらは応答変数と同じ立場にあり、どちらも制御外のランダムプロセスによって決定されます。を「修正済み」と見なすことにより、原因となる可能性のある多くの問題を考慮しないことにします。 x

一方、リグレッサを確率論的であると見なすことで、計量経済学者がそうであるように、そのような問題を考慮しようとするモデリングの可能性を開きます。次に検討し、モデリングに組み込む問題の短いリストは次のとおりです。

  • リグレッサの測定エラー
  • リグレッサとエラー項の間の相関
  • リグレッサとしての遅延応答
  • ...

おそらく、それは今日行われるよりもはるかに頻繁に行われるべきですか?

EDIT 

私はリグレッサをもう少し形式的に条件付けるための議論を具体化しようとするでしょう。ましょうランダムベクトルであり、そして関心が回帰であるに回帰は条件付き期待値を意味するものと解釈される、上の。線形関数になりますが、私たちの引数はそれに依存していません多正規仮定の下で。通常の方法で結合密度を因数分解することから始めます しかし、それらの関数は不明であるため、パラメーター化されたモデル ここで、は条件付き分布とパラメーター化します(Y,X)YXYX

f(y,x)=f(yx)f(x)
f(y,x;θ,ψ)=fθ(yx)fψ(x)
θψの周辺分布。通常の線形モデルでは、を使用できますが、これは想定されていません。の完全なパラメーター空間は、デカルト積であるであり、2つのパラメーターには共通点はありません。Xθ=(β,σ2)(θ,ψ)Θ×Ψ

これは、統計実験(またはデータ生成プロセス、DGP)の因数分解として解釈できます。最初のはに従って生成され、2番目のステップとして、条件付き密度に従ってが生成されます。。最初のステップでは、2番目のステップでのみ入力されるに関する知識を使用しないことに注意してください。統計は補助です。https://en.wikipedia.org/wiki/Ancillary_statisticを参照してくださいXfψ(x)Yfθ(yX=x)θXθ

ただし、最初のステップの結果によっては、2番目のステップでについて多少の情報が得られる場合があります。たとえば、によって与えられる分布の分散が非常に低い場合、観測されたは小さな領域に集中するため、を推定することはより困難になります。したがって、この2段階の実験の最初の部分は、を推定できる精度を決定します。したがって、回帰パラメーターについての推論では、を条件とするのが自然です。これは条件付きの議論であり、上記の概要はその仮定を明らかにしています。θfψ(x)xθθX=x

設計された実験では、その仮定はほとんど保持されますが、多くの場合観測データでは保持されません。問題のいくつかの例は次のとおりです。予測子として遅れた応答を使用した回帰。この場合の予測子の条件付けは、応答の条件付けも行います。(さらに例を追加します)。

この問題を非常に詳細に説明している1つの本は、情報と指数関数のファミリです。O。E Barndorff-Nielsenによる統計理論では。参照してください。特に第4章は、著者は言う。このような状況で分離ロジックは、しかし、ほとんどexplicatedされていないが、次の参照を与える:RAフィッシャー(1956)統計的方法と科学的推論 とSverdrup(1966)決定理論の現状とネイマン・ピアソン理論§4.3

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.