私はこのペーパープレプリントを読んでおり、ガウスプロセス回帰の方程式の導出を理解するのに苦労しています。彼らはラスムッセンとウィリアムズの設定と表記法を使用しています。したがって、添加剤、ゼロ平均、固定及び正常分散とノイズ分散想定されます。σ2noise
y=f(x)+ϵ,ϵ∼N(0,σ2noise)
ゼロ平均を有する従来A GPのために想定される、手段∀ D ∈ N、F = { F (X 1)、... 、Fは(X D)}平均0及び共分散行列を有するガウスベクトルでありますf(x)∀ d∈Nf={f(x1),…,f(xd)}
Σd=⎛⎝⎜⎜k(x1,x1)k(xd,x1)⋱k(x1,xd)k(xd,xd)⎞⎠⎟⎟
これからは、ハイパーパラメータが既知であると仮定します。次に、論文の式(4)は明白です。
p(f,f∗)=N(0,(Kf,fKf∗,fKf∗,fKf∗,f∗))
ここで疑問が生じます:
式(5):
p(y|f)=N(f,σ2noiseI)
E[f]=0E[y|f]=f≠0fy=c+ϵcϵ
とにかく、それは私にはより不明瞭な式(6)です。
p(f,f∗|y)=p(f,f∗)p(y|f)p(y)
これは、ベイズの定理の通常の形式ではありません。ベイズの定理は
p(f,f∗|y)=p(f,f∗)p(y|f,f∗)p(y)
2つの方程式が同じである理由を私はある程度理解しています。直感的に、応答ベクトルは対応する潜在ベクトルにのみ依存するため、
またはは同じ分布になるはずです。ただし、これは直感であり、証明ではありません。理由を教えてください。yff(f,f∗)
p(y|f,f∗)=p(y|f)