ブートストラップフィルター/粒子フィルターアルゴリズム（理解）

ブートストラップフィルターがどのように機能するかについて、本当に理解が不足しています。私はおおまかに概念を知っていますが、特定の詳細を把握できません。この質問は、混乱を解消するためのものです。ここでは、doucetのリファレンスからこの人気のあるフィルターアルゴリズムを使用します（これまでのところ、これが最も簡単なリファレンスだと思います）。私の問題は、どの分布が既知であり、どの分布が未知であるかを理解していることです。

これらは私の質問です：

2）では、分布何ですか？この分布は知られていますか？すべてのについてこの分布を知っていますか？もしそうなら、しかしそれからサンプリングできない場合はどうでしょうか？彼らがこの重要性のサンプリングステップと呼んでいるのは面白いが、提案の分布は見られない。 $p(x_t|x^{(i)}_{t-1})$ $t$
また）2である、既知の分布は？「ノーマライズ重要度重み手段に $p(y_t|\tilde{x}^{(i)}_{t})$ ？とチルダはどういう意味ですか？それぞれ、リサンプリングされていない、または正規化されていないようなものですか？ $w^{(i)}_{t}=\frac{\tilde{w}^{(i)}_{t}}{\sum_{i=1}^{N}\tilde{w}^{(i)}_{t}}$ $x$ $w$
よく知られているディストリビューションを使用してこのブートストラップフィルターを使用する簡単なおもちゃの例を提供できれば幸いです。ブートストラップフィルターの最終目標は明確ではありません。

particle-filter

— タンタン
ソース

それは状態の遷移密度（）であり、これはモデルの一部であり、したがって既知です。基本的なアルゴリズムでそれからサンプリングする必要がありますが、近似が可能です。は、この場合の提案分布です。分布は一般に扱いにくいために使用されます。 $x_t$ $p(x_t|x_{t-1})$ $p(x_t|x_{0:t-1},y_{1:t})$
はい、それは観測密度であり、これもモデルの一部であり、したがって既知です。はい、それが正規化の意味です。チルダは、のようなものを意味するために使用される「予備」：であるリサンプリングの前に、とある繰り込み前。リサンプリングステップを持たないアルゴリズムのバリアント間で表記法が一致するように、この方法で行われると思います（つまり、は常に最終的な推定値です）。 $\tilde{x}$ $x$ $\tilde{w}$ $w$ $x$
ブートストラップフィルタの最終目標は、条件付き分布のシーケンス推定することである（にて観察不能な状態まで、すべての観測値を与えられ、）。 $p(x_t|y_{1:t})$ $t$ $t$

単純なモデルを考えてみましょう。

{バツ}_{t} = {バツ}_{t - 1} + η_{t} 、 η_{t} 〜 N （ 0 、 1 ）

$X_t = X_{t-1} + \eta_t, \quad \eta_t \sim N(0,1)$

{バツ}_{0} 〜 N （ 0 、 1 ）

$X_0 \sim N(0,1)$

Y_{t} = {バツ}_{t} + ε_{t} 、 ε_{t} 〜 N （ 0 、 1 ）

$Y_t = X_t + \varepsilon_t, \quad \varepsilon_t \sim N(0,1)$

これは、ノイズのあるランダムウォークです（ではなくのみが観察されます） $Y$ $X$ ）。あなたは計算することができ正確にカルマンフィルタで、私たちはあなたの要求に応じて、ブートストラップ・フィルタを使用します。状態遷移分布、初期状態分布、および観測分布（この順序で）の観点からモデルを再記述できます。これは、粒子フィルターにとってより便利です。 $p(X_t|Y_1, ..., Y_t)$

{バツ}_{t} | {バツ}_{t - 1} 〜 N （ {バツ}_{t - 1} 、 1 ）

$X_t | X_{t-1} \sim N(X_{t-1},1)$

{バツ}_{0} 〜 N （ 0 、 1 ）

$X_0 \sim N(0,1)$

Y_{t} | {バツ}_{t} 〜 N （ {バツ}_{t} 、 1 ）

$Y_t | X_t \sim N(X_t,1)$

アルゴリズムの適用：

初期化。我々が生成する粒子を（独立に）に係る。 $N$ $X_0^{(i)} \sim N(0,1)$
私たちは、生成することにより、独立して前方に各粒子をシミュレート $X_1^{(i)} | X_0^{(i)} \sim N(X_0^{(i)},1)$ $N$

$\tilde{w}_t^{(i)} = \phi(y_t; x_t^{(i)},1)$ $\phi(x; \mu, \sigma^2)$ $\mu$ $\sigma^2$ $y_t$
$w_t$ $x$ $x_{0:t}^{(i)}$

シリーズ全体を処理するまで、リサンプリングされたパーティクルを使用して、手順2に戻ります。

Rの実装は次のとおりです。

# Simulate some fake data
set.seed(123)

tau <- 100
x <- cumsum(rnorm(tau))
y <- x + rnorm(tau)

# Begin particle filter
N <- 1000
x.pf <- matrix(rep(NA,(tau+1)*N),nrow=tau+1)

# 1. Initialize
x.pf[1, ] <- rnorm(N)
m <- rep(NA,tau)
for (t in 2:(tau+1)) {
  # 2. Importance sampling step
  x.pf[t, ] <- x.pf[t-1,] + rnorm(N)

  #Likelihood
  w.tilde <- dnorm(y[t-1], mean=x.pf[t, ])

  #Normalize
  w <- w.tilde/sum(w.tilde)

  # NOTE: This step isn't part of your description of the algorithm, but I'm going to compute the mean
  # of the particle distribution here to compare with the Kalman filter later. Note that this is done BEFORE resampling
  m[t-1] <- sum(w*x.pf[t,])

  # 3. Resampling step
  s <- sample(1:N, size=N, replace=TRUE, prob=w)

  # Note: resample WHOLE path, not just x.pf[t, ]
  x.pf <- x.pf[, s]
}

plot(x)
lines(m,col="red")

# Let's do the Kalman filter to compare
library(dlm)
lines(dropFirst(dlmFilter(y, dlmModPoly(order=1))$m), col="blue")

legend("topleft", legend = c("Actual x", "Particle filter (mean)", "Kalman filter"), col=c("black","red","blue"), lwd=1)

結果のグラフ：

有用なチュートリアルはDoucetとJohansenによるものです。こちらをご覧ください。

— クリスハウグ
ソース

X_{1}^{(i)} | X_{0}^{(i)} \sim N (0, 1)

$X_1^{(i)} | X_0^{(i)} \sim N(0,1)$

X_{1}^{(i)} | X_{0}^{(i)} \sim N (X_{0}^{(i)}, 1)

$X_1^{(i)} | X_0^{(i)} \sim N(X_0^{(i)},1)$

それは正しい、私はタイプミスを修正した

— クリスハウグ

パスを再サンプリングする必要はありませんか？他の文献から、パスをサンプリングする必要はありません。各タイムステップで粒子をサンプリングするだけです。パスをリサンプリングする理由があるかどうか疑問に思っていました

— -tintinthong