次の二変量回帰モデルを仮定
IIDであるのために。U 、I N (0 、σ 2 = 9 )I = 1 、... 、n個
y私= βバツ私+ u私、
あなた私N(0 、σ2= 9 )i = 1 、… 、n
noninformative前想定、のための事後PDFことを示すことができるである
ここでβ P (β | Y)= (18 π )- 1p (β)∝ 定数β β =(Σ N iは= 1、YIXのI)/(Σ N iは= 1、X 2 のI)。
p (β| Y)=(18π)− 12(Σi = 1んバツ2私)12exp[ − 118Σi = 1んバツ2私(β- β^)2]、
β^= (∑んi = 1y私バツ私)/(∑んi = 1バツ2私)。
今の値考慮所定の将来値と、:
はiid、
は、期待値と分散
E [y_ { n + 1} | x_ {n + 1}、\ mathbf {y}] = \ hat {\ beta} x_ {n + 1}、\ quad {\ rm var} [y_ {n + 1} | x_ {n +1}、\ mathbf {y}] = \ frac {9 [x_ {n + 1} ^ 2 + \ sum_ {i = 1} ^ n x_i ^ 2]} {\ sum_ {i = 1} ^ n x_i ^ 2}。
したがって、x_ {n + 1}を条件とするy_ {n + 1}の事後確率密度関数は、
、X 、X N + 1、Y N + 1 = β X N + 1 + U N + 1、U N + 1 N (0 、σ 2 = 9 )、P (Y N + 1 | X N + 1、Y)= ∫ β + 1、β 、Y)、P (yバツバツn + 1
yn + 1= βバツn + 1+ un + 1、
あなたn + 1N(0 、σ2= 9 )p (yn + 1| バツn + 1、y)= ∫βp (yn + 1| バツn + 1、β、y)p (β| y) dβ
yn+1xE[ yn + 1| バツn + 1、y ] = β^バツn + 1、v a r [ yn + 1| バツn + 1、y ] = 9 [ x2n + 1+ ∑んi = 1バツ2私]Σんi = 1バツ2私。
yn + 1バツn + 1p (yn + 1| バツn + 1、y)=⎛⎝⎜⎜⎜⎜⎜18個のπ[ x2n + 1+ ∑i = 1んバツ2私]Σi = 1んバツ2私⎞⎠⎟⎟⎟⎟⎟− 12× exp⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪− ∑i = 1んバツ2私18 (x2n + 1+ ∑i = 1んバツ2私)(yn + 1- β^バツn + 1)2⎫⎭⎬⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪
ここでの問題は、 95%の予測間隔を指定し、それを慎重に解釈することです。データ生成プロセスのどの側面で、間隔は不確実性に対応できませんか?yn + 1
質問への答え方はよくわかりませんが、これが私の試みです。
そう本質的に我々はいくつか見つける必要がとようにabP(a < yn + 1< b )= ∫bap (yn + 1| バツn + 1、y)dyn + 1= 95 %
でことがわかりました。ここで、および、したがって、
yn + 1| バツn + 1、Y〜N(m 、v2)m = E[ yn + 1| バツn + 1、y ]v2= v a r [ yn + 1| バツn + 1、y ]
yn + 1− mv〜N(0 、1 )
P(−1.96v+m<yn+1<1.96v+P(− 1.96 < yn + 1− mv< 1.96 )= 95 %
P(− 1.96 v + m < yn + 1< 1.96 v + m )= 95 %
ここで、を条件にしてと式を調べているので、と両方が既知の値であることがわかります。したがっておよびをとることができます。つまり、確率をもたらすと他の多くの可能性を選択できますがこれは、この間隔がデータ生成プロセスのどの側面に対応できないかを尋ねる質問の回答にどのように関係しますか? v m v m a = − 1.96 v + m b = 1.96 v + m a b 95 %バツn + 1vメートルvメートルa = − 1.96 v + mb = 1.96 v + mab95 %