薄板平滑化スプラインの確率論的解釈


8

TLDR:薄板回帰スプラインには確率的/ベイズ的解釈がありますか?

入力-出力ペア所与の(xi,yi)i=1,...,n ; Iは、関数推定するf()としては、下記の

f(x)u(x)=ϕ(xi)Tβ+i=1nαik(x,xi),
k(,)ϕ(xi)m<nαiβi
minαRn,βRm1nYΦβKαRn2+λαTKα,
Φϕ(xi)Ti,jKk(xi,xj)
α=λ1(I+λ1K)1(YΦβ)
\ begin {式} \ beta ^ * = \ {\ Phi ^ T(I + \ lambda ^ {-1} K)^ {-1} \ Phi \} ^ {-1} \ Phi ^ T(I + \ lambda ^ {- 1} K)^ {-1} Y。\ end {equation} k(\ cdot、\ cdot)が正定カーネル関数である
β={ΦT(I+λ1K)1Φ}1ΦT(I+λ1K)1Y.
と仮定すると、このソリューションは、次のベイジアンモデルの最良線形不偏予測子と見なすことができます: \ begin {equation} y〜\ vert〜( \ beta、h(\ cdot))〜\ sim〜N(\ phi(x)\ beta + h(x)、\ sigma ^ 2)、\ end {equation} \ begin {equation} h(\ cdot)〜 \ sim〜GP(0、\ tau k(\ cdot、\ cdot))、\ end {equation} \ begin {equation} \ beta \ propto1、\ end {equation} where \ sigma ^ 2 / \ tau = \ lambdaそしてGPはガウス過程を示しています。例を見るk(,)
y | (β,h())  N(ϕ(x)β+h(x),σ2),
h()  GP(0,τk(,)),
β1,
σ2/τ=λGPhttps://www.ncbi.nlm.nih.gov/pmc/articles/PMC2665800/

私の質問は次のとおりです。私は聞かせたとしk(x,x):=|xx|2ln(|xx|)ϕ(x)T=(1,x)、すなわち薄板スプライン回帰。ここで、k(,)は正の半定関数ではなく、上記の解釈は機能しません。上記のモデルとそのソリューションは、k(,)が正の半定値である場合と同様に、確率論的解釈を持っていますか?


が次元空間にあるか、少なくとも整数が偶数であると想定しているようです。xdd=2d
イブ

わかりました、それでどういう意味ですか?
MthQ 2018年

2
この質問では、はスカラーであると考える人がいるかもしれません。この場合にはDuchonのカーネルの形式を有するを有する整数であり、通常の平滑化スプライン用。確率論的解釈はほとんど変わらないと思いますが、GPは非定常的です。これは本質的なランダム関数です。通常の平滑化スプラインの場合、これは統合されたウィーナープロセスであることがわかります。xi|xx|2m1mm=2
Yves

1
@Yves面白いですね。コメントを回答に拡張し、固有のランダム関数とは何かをもう少し説明し、平滑化スプラインの古典的な例を追加することができます。TPSカーネルが非定常GPを引き起こすこと証明することについて心配する場合、特に事後予測分布の分散の非パラメトリック推定を追加する場合、シミュレーションはおそらく妥協に役立つ可能性があります。
DeltaIV 2018年

@DeltaIV。ありがとうございました。私はそれをやろうとします、まだ簡単な仕事ではありません。これは、関数がカーネルに関連する適切な多項式である場合に当てはまるとしていますが、これは、より古典的なGPコンテキストのように、任意のない可能性があります。ϕjϕj
Yves

回答:


5

質問のモデルを ここで、は、インデックス観測されていないGPで あり、は、分散。GPは通常、中央に配置され、定常的で非決定的であると見なされます。という用語は、カーネルを持つ(決定論的)GPと見なすことができることに 注意してください ここで、

(1)Yi=ϕ(xi)β+h(xi)+εi
h(x)xRdεiσ2ϕ(x)βϕ(x)Bϕ(x)Bは「無限値」の共分散行列です。実際、 をとすると、質問のクリギング方程式が得られます。これは、拡散と呼ばれます。の適切な事後は 、行列がフルランクの場合にのみ得られます。したがって、モデルは次のように書き込みます。 where is GP 。がもはやGPではなく、GPである場合、同じベイズ解釈を制限付きで使用できます。B:=ρIρββΦ
(2)Yi=ζ(xi)+εi
ζ(x)ζ(x)組み込みランダム関数(IRF)。派生はG. Wahbaの本にあります。IRFの概念の読みやすいプレゼンテーションは、たとえば、N。Cressieの本や、以下に引用するMardiaらの記事にあります。IRFは、離散時間のコンテキスト(ARIMAなど)でよく知られている統合プロセスに似ています。IRFは、一種の差分演算によって古典的なGPに変換されます。

IRFの2つの例を次に示します。最初に、初期条件が拡散初期条件に置き換えられたWienerプロセスを考えます。は、無限の分散を伴う通常の状態です。値がわかれば、ウィーナーGPと同様にIRFを予測できます。次に、式で与えられる統合ウィーナープロセスを考え。はウィーナー過程です。GPを取得するには、2つのスカラーパラメーターが必要です 2つの値 と必要ですd=1ζ(x)ζ(0)=0ζ(0)ζ(x)

d2ζ(x)/dx2=dW(x)/dx
W(x)ζ(x)ζ(x)xx、または値 といくつかの選択される。2つの追加のパラメーターは、無限の共分散行列をもつガウス結合であると考えることができます。どちらの例でも、適切な有限の観測セットが利用可能になるとすぐに、IRFはGPとしてほぼ対処されます。さらに、微分演算子を使用しました:およびそれぞれ。nullspaceは、 ような関数線形空間です。定数関数が含まれています ζ(x)dζ(x)/dxx2×2L:=d/dxL:=d2/dx2Fϕ(x)Lϕ=0ϕ1(x)=1最初のケースでは、関数および 、2番目のケースでは。最初の例では、 は最初の例の任意の固定 GPであり、同様には2番目の場合のGPです。ϕ1(x)=1ϕ2(x)=xζ(x)ζ(x+δ)δζ(xδ)2ζ(x)+ζ(x+δ)

一般的な次元について、定義された関数の線形空間を考えます。我々は、呼び出し増加 に対しての有限のコレクション位置 と実際の重みよう を例のヌルスペースと 考えてください。最初の例では、たとえばを 任意のとで取り、dFRdFsxiRdsνi

i=1sνiϕ(xi)=0 for all ϕF.
Fs=2x1x2[1,1]。2番目の例では、 等間隔の sとます。IRFの定義には、関数および関数スペースが含まれます。これは、条件付きで正の wrtであるため、 ははに対する増分です。及びs=3xiν=[1,2,1]Fg(x,x)F
i=1sj=1sνiνjg(xi,xj)0
[νi,xi]i=1sFFg(x,x) 共分散カーネルを作成できるため、マルディア他と同様にGPを使用できます。線形微分演算子から始めて、ヌルスペースをとして使用できます。この場合、IRFは方程式ガウスノイズと関連します。LFLζ=

IRFの予測の計算は、質問とほぼ同じですが、は置き換えられています。 ですが、は基礎を形成しています。余分な制約 最適化問題に追加する必要があります。これにより、が許可され 。必要に応じて、ない基底関数をさらに追加でき ます。これは確定的なGPを追加する効果があります。たとえば、をIRF に追加します k(x,x)g(x,x)ϕi(x)FΦα=0αKα0Fψ(x)γζ(x)(2)の)。

薄板スプラインは、ような整数依存します。空間は、次数の低い多項式を含み、次元はおよび依存します。場合ことを示すことができる のために、以下の関数である次に は、条件付きで正のwrt定義します。構造は微分演算子関係しますmm>2dFp(m)mdE(r)r0

E(r):={(1)m+1+d/2r2mdlogrd even,r2mdd odd,
g(x,x):=E(xx)FL。それはのためにことが判明し及びと、薄板スプラインは、上記集積ウィナー例に関する通常の天然の三次スプライン、より何もない。したがって、(2)は通常の平滑化スプラインモデルと同じです。場合及び零空間は、次元有する と関数によって生成された、および。d=1m=2g(x,x)=|xx|3d=2m=2p(m)=31x1x2

空間データのクレシーN 統計。ワイリー1993。

マルディアKV、ケントJT、グドールCR、リトルJA。クリギングとスプラインと派生情報。Biometrika (1996)、83,1、pp。207-221。

観測データの Wahba G スプラインモデル。SIAM 1990。

王、Y スムージングスプライン、メソッド、アプリケーション。チャップマンとホール、2011年。


多大なご協力をいただき、誠にありがとうございました。もう1つ質問があります。したがって、(の基底関数の上に基底関数を追加しても、解釈は変わりません 。しかし、私が気付いたのは、上記の質問で与えられた解決策が常に満たしていることです。。これはどのように解釈できますか?ϕ()Fζ()αΦα=0ϕ()F
MthQ 2018年

はい。どちらの場合も、近似には基底関数があり、観測値のみが使用されます。したがって、係数およびたランク不足の回帰のようなものがあります。部分はペナルティが課されないため、線形制約をもたらす部分よりもの変動をより多く「吸収」する傾向があります。「カーネルシフト」関数をとして使用することを禁止するものは何もないことに注意してください。それらすべてを使用する場合、すべてのn+pf(x)nβiαjβyαpnxk(x,xi)ϕj(x)αj合理的であるように、ゼロです。
イブ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.