ベイジアンオンラインチェンジポイント検出(マージナル予測分布)


9

私は、AdamsとMacKayによるベイジアンのオンラインチェンジポイント検出ペーパー(リンク)を読んでいます

著者は限界予測分布を書くことから始めます: ここで

P(xt+1|x1:t)=rtP(xt+1|rt,xt(r))P(rt|x1:t)(1)
  • txtは時間での観測です。t
  • tx1:tは、時刻までの一連の観測を示します。t
  • rtNは現在のランレングスです(最後の変化点からの時間。0でもかまいません)。そして
  • r txt(r)は、実行関連付けられた観測値のセットです。rt

Eq。1は正式に正しい(@JuhoKokkalaによる以下の返信を参照)が、について実際に予測したい場合は、次のように展開する必要があると理解しています。xt+1

P(xt+1|x1:t)=rt,rt+1P(xt+1|rt+1,xt(r))P(rt|x1:t)P(rt+1|rt)(1b)

私の推論では、(将来の)時間に変化点がある可能性がありますが、事後はまでしかカバーしません。P r t | x 1 ttt+1P(rt|x1:t)t

重要なのは、この論文の著者が方程式を利用することです。1はそのままで(論文の式3と11を参照)、1b ではありません。したがって、時間利用可能なデータから予測する場合、時間での変化点の可能性を無視しているようです。セクション2の初めに、彼らはen passantと言いますx t + 1 tt+1xt+1t

与えられたランレングス条件として[ ] 予測分布を計算できると仮定します。 r txt+1rt

おそらくそこに秘訣があります。しかし、一般的に、この予測分布は次のようになります。1b; これは彼らがしていることではない(Eq。11)。

だから、何が起こっているのかよくわかりません。おそらく、この記法で何かおかしいことが起こっています。


参照

  • Adams、RP、およびMacKay、DJ(2007)。ベイジアンオンライン変化点検出。arXivプレプリント arXiv:0710.3742。

潜在的な説明は、が時間ステップ終了時のランレングスを表すということです。これは、時間変化点のです。これにより、Eq。1は理にかなっています。実際、アルゴリズムの初期化の1つは、を設定することです。これは、での開始の直前に変化点があると想定しています。ただし、図1は、図1aに示すようにと間、およびと間に変化点がある場合、間違っている(または少なくとも誤解を招く)ので、および t t P r 0 = 0 = 1 t = 1 t = 4 t = 5 t = 10 t = 11 r 4 r 10 r 5 r 11rtttP(r0=0)=1t=1t=4t=5t=10t=11r4r10この表記によれば0でなければならず、図1bのようにおよびではありません。r5r11
lacerbi 2016

1
Eqで何か奇妙なことが起こっています。3は、最後の行の加数の中間因子が 、はが含まれていると思いました。が理にかなっているので、とが入れ替わったのではないかと思います。Eq。11、右辺は左辺にはまったく出てこないに依存しているようですので、何かおかしいか、表記が全くわかりません。x r t x t t t 1P(xtrt1,xt(r))xt(r)xttt1x r tP(xtrt,xt1(r))xt(r)
Juho Kokkala

@JuhoKokkala:私がその気持ちを持っているのは私だけではないことを嬉しく思います...
lacerbi

1
@lacerbi、私はこのペーパーについて別の質問があります。あなたはその仕事に精通しているように見えるので、あなたはそれに答えられるかもしれないと思います:stats.stackexchange.com/questions/419988
gwg

回答:


5

(1)と(1b)の両方が正しい。OPは(このモデルでは)変更点がある可能性があり、は変更点があるかどうかによって異なります。これは、の可能な値がによって完全に「カバー」されるため、(1)の問題を意味するものではありません。は、条件とする条件付き分布を意味します。この条件付き分布は、条件とするを含む「その他すべて」の平均です。たとえば、と書くことができます。x t + 1 r t + 1 P x t + 1r tx 1 tP x t + 1 | r tx 1 tx t + 1r tx 1 tr t + 1r tt+1xt+1rt+1P(xt+1rt,x1:t)P(xt+1|rt,x1:t)xt+1(rt,x1:t)rt+1(rt,x1:t)P(xt+1000|xt)、だけでなく、として考慮にchangepointsのすべての可能な構成を取ることになるの値の発生の間と。xitt+1000

残りの部分では、最初に(1)を導出し、次に(1b)を(1)に基づいて導出します。

(1)の導出

任意の確率変数、次のようになります。 は、が離散である限り(そうでない場合、合計を積分で置き換える必要があります)。これを:A,B,C

P(AB)=cP(AB,C=c)P(C=cB),
Cxt+1,x1:t,rt

P(xt+1x1:t)=rtP(xt+1rt,x1:t)P(rtx1:t),
は、、、間の依存関係が何であっても保持します。つまり、モデルの仮定はまだありません使用されました。本モデルでは、所与 *の値の条件付き独立であると仮定される前の実行から。これは、意味します。これを前の方程式に代入すると、rtx1:txt+1xt+1rt,xt(r)xxt(r)P(xt+1rt,x1:t)=P(xt+1rt,xt(r))

P(xt+1x1:t)=rtP(xt+1rt,xt(r))P(rtx1:t),(1)
これはOPでは(1)です。

(1b)の導出

P(xt+1rt,xt(r))rt+1

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,rt,xt(r))P(rt+1rt,xt(r)).

t+1r xtxt+1xP(rt+1rt,xt(r))=P(rt+1rt)rt+1xt+1xtP(xt+1rt+1,rt,xt(r))=P(xt+1rt+1,xt(r))

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,xt(r))P(rt+1rt).
これを(1)に代入すると、 これはOP(1b)です。
P(xt+1x1:t)=rt(rt+1P(xt+1rt+1,xt(r))P(rt+1rt))P(rtx1:t),(1b)

*モデルの条件付き独立性仮定に関する注釈

論文をすばやく閲覧することに基づいて、私は条件付き独立プロパティをどこかでより明確に述べたいと思いますが、意図は、がマルコビアンであり、異なる実行に関連付けられている:sが独立している(実行が与えられている)と想定しています。xrx


1
(+1)ありがとう。はい、もちろん、私はその式を理解しています。1は、に対する暗黙的な周辺化を想定している場合、正式に正しいです。問題は、後で著者が予測を行い(論文の式11、暗黙的に式3)、それらがをするように見えることです。 r t + 1rt+1rt+1
lacerbi 2016

1
ああ。それから私は質問を誤解したようです-これを削除するべきですか?質問を明確にしたいと思うかもしれませんが、現在(1)は(おそらく役に立たないのではなく)どういうわけか間違っているようです
Juho Kokkala

この回答は大切に保管してください。元の投稿では十分に明確ではなかった私の間違い。私はあなたのコメントのおかげで私の質問を明確にしようとしましたが、それでもこの回答を意味のあるものにしました。
lacerbi 2016
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.