回答:
たぶん私はオフになっていますが、私はOP (について疑問に思っているべきだと思います。モデルがある場合、線形回帰の非常に最も簡単なケースでは、Y = X β + ε次いで、モデル内の唯一の確率的成分は、誤差項です。そのため、yのサンプリング分布を決定します。もしε 〜N (0 、σ 2 I )、その後のy | X 、β 〜N (X β 、。ただし、@ Anikoの言うことは、 f (y )(わずかに X 、β)については確かに真実です。そのため、問題は少し曖昧です。
簡単な答えは、の分布については何も結論づけられないということです。これはxの分布と関係の強さと形状に依存するためです。より正式には、yには「正規分布の混合」分布があり、実際にはほとんど何でもかまいません。
これを説明する極端な例を2つ示します。
実際、すべての分布は正規分布の混合で任意に近似できるため、実際に分布を取得できます。
実際のデータに架空のモデルを課すことにより、エラー用語を発明します。エラー項の分布は応答の分布に影響しません。
誤差が正規分布しているとしばしば仮定するため、推定残差が正規分布するようにモデルを構築しようとします。これは、分布によっては難しい場合があります。これらの場合、応答の分布がエラー項に影響すると言うことができると思います。
応答をとして書き出す 場合、mは「モデル」(yの予測)で、eは「エラー」である場合、これを再配置してy − m = eを示すことができます。したがって、エラーに分布を割り当てることは、モデルが不完全な方法を示すことと同じです。別の言い方をすれば、観測された応答が、モデルが予測したものではなく、実際の値であった理由がわからない範囲を示しているということです。モデルが完全であることがわかっている場合は、エラーに対してすべての質量がゼロになる確率分布を割り当てます。Nの割り当て(
ある意味では、エラー分布は応答よりもモデルにより密接にリンクしています。これは、両方の場合のために、上記の式の非識別性から分かるとeはに任意のベクトルを付加し、未知であり、Mとからそれを差し引くのEの同じ値にリードY、Y = M + E = (M + b )+ (e − b )= m ′ + e ′。誤差分布とモデル方程式の割り当ては、基本的に、どの任意のベクトルが他のベクトルよりももっともらしいかを示しています。