SEコミュニティ、次の問題についていくつかの洞察を得たいと思います。単純な線形回帰モデル与えられた場合 等分散誤差項を持つガウス尤度関数の下では、従属変数の条件付き分布はの形式をとります および 前に条件付き(有益でない)共役を割り当てます は。周辺事後分布が多変量tであるのは 標準的な結果ですY | β 、H 〜N (Xのβ 、H - 1つの I )。β 時間β | H 〜N (0 、C I )、H 〜G (S - 2、V )
β β | D 〜T N(β、Σ、T )。
が特異な
場合はどうなりますか?標準回帰では、を使用する代わりに、一般化されたMoore-Penrose疑似逆を使用します。ただし、この場合、事後分散も特異であり、 -Distributionがまだ明確に定義されているとは思えません。これは正しいです?(X ' X )+(X ' X )- 1 Σ:= C (X ' X )- 1 T
さらに気が散る:私は事後分布ではなく、線形結合にのみ興味があると仮定します。ここで、および。その分布は実際には定義されていないもの(分布)に基づいていますが、その分布からサンプリングできます。これを処理する方法はありますか?それとも私の質問の本質的な間違いが私の主張全体を時代遅れにしているのでしょうか?
2
データがモデルパラメーターを一意に特定する場合、情報提供のない事前分布は、せいぜい、有益な結果を提供します。この観察が、OLSだけに依存するのではなく、リッジ回帰とその関連がある理由です。しかし、データが十分な情報を提供しない場合、通常は、正規化された回帰ルート(尾根など)または完全なベイズルートのいずれかを使用します。完全なベイズルートでは、データに関する適切で有益な事前分布を定義するだけで、問題は扱いやすくなります。
—
Sycoraxは、モニカを2015
これまでのコメントありがとうございます!の後部が適切に定義されていないという点がわかります。しかし、これは本当に、少なくとも理論的に明確に定義されている確率変数問題を引き起こし ますか?
—
muffin1974
上手。私を混乱させるのは、解決策への道がまったく満たされていないにもかかわらず、の後方がもっともらしいように見えることです。検索に時間を浪費する代わりに、直接回帰パラメーターを取得することが可能であると楽観視しているため、現在、回帰方程式を書き換える方法を探しています。しかし、これは私の特定のケースでは可能であるように見えますが、「悪い」モデルが機能しているモデルにネストされている場合、それが何を意味するのかという疑問が残ります...
—
muffin1974