隠れマルコフモデルと粒子フィルター(およびカルマンフィルター)の違い


21

ここに私の古い質問があります

隠れマルコフモデル(HMM)とパーティクルフィルター(PF)の違い(違いがある場合)を誰かが知っているかどうか、そして結果としてカルマンフィルター、またはどの状況でどのアルゴリズムを使用するかを尋ねたいと思います。私は学生で、プロジェクトをしなければなりませんが、最初にいくつかのことを理解する必要があります。

そのため、参考文献によれば、両方とも状態空間モデルであり、隠された(または潜在的または観察されていない)状態を含みます。ウィキペディア(Hidden_​​Markov_model)によると、HMMでは、隠れ変数の状態空間は離散的ですが、観測自体は離散的(通常はカテゴリ分布から生成)または連続的(通常はガウス分布から)のいずれかです。隠れマルコフモデルは、連続状態空間を可能にするために一般化することもできます。そのようなモデルの例は、隠れ変数に対するマルコフ過程が線形動的システムであり、関連する変数間に線形関係があり、すべての隠れ変数と観測変数がガウス分布に従うモデルです。前述の線形動的システムなどの単純な場合、正確な推論は扱いやすい(この場合は、カルマンフィルターを使用)。ただし、一般に、連続的な潜在変数を持つHMMでの正確な推論は実行不可能であり、近似方法を使用する必要があります。

しかし、私にとってこれは少しわかりにくいです...簡単な言葉で言えば、これは次のことを意味します(私が行ったより多くの研究にも基づいています):

  • HMMでは、状態空間は離散または連続のいずれかです。また、観測自体は離散または連続のいずれかです。また、HMMは線形およびガウスまたは非ガウスの動的システムです。
  • PFでは、状態空間は離散または連続のいずれかです。また、観測自体は離散または連続のいずれかです。しかし、PFは非線形(および非ガウス?)動的システムです(その違いは違いますか?)。
  • カルマンフィルター(HMMと同じように見えます)は、線形およびガウスの動的システムがある場合に使用されます。

また、どのアルゴリズムを選択するかを知るには、これらはすべて同じように見えるので...また、PFは線形データ(たとえば、センサーKinectからの生データ)を持つことができると言う論文(英語ではない)を見つけました動きを認識する)、動的システムは非線形である場合があります。これは起こりますか?これは正しいです?どうやって?

ジェスチャ認識では、研究者はHMMまたはPFのいずれかを使用できますが、各アルゴリズムを選択する理由を説明していません。これらのアルゴリズムを区別し、違いを理解し、最適なアルゴリズムを選択する方法を誰かが知っていますか?

私の質問が大きすぎる場合、または一部の部分が素朴な場合は申し訳ありませんが、説得力のある科学的な答えはどこにも見つかりませんでした。ご清聴ありがとうございました!

ここに私の新しい質問があります(@conjugatepriorの助けによると)

したがって、さらに読みながら、以前のコメントの一部を更新し、何が起こっているのかをもう少し理解したいと思います。

  • 簡単に言えば、傘は動的ベイジアンネットワークであり、その下にHMMおよび状態空間のモデル(サブクラス)が含まれます(http://mlg.eng.cam.ac.uk/zoubin/papers/ijprai.pdf)。
  • さらに、2つのモデルの最初の違いは、HMMでは隠れた状態変数が離散的であり、観測値は離散または連続的であるということです。PFでは、隠れ状態変数は連続的であり(実数値の隠れ状態ベクトル)、観測値はガウス分布を持ちます。
  • また、@ conjugatepriorによれば、各モデルには次の3つのタスクがあります:フィルタリング、平滑化、予測。フィルタリングでは、モデルHMMは離散隠れ状態変数にフォワードアルゴリズム法を使用し、状態空間は連続変数に使用し、線形動的システムはカルマンフィルターなどを使用します。
  • ただし、HMMを一般化して、連続状態空間を許可することもできます
  • これらのHMMの拡張により、2つのモデルは概念的に同一であるように見えます(隠れマルコフモデルとマルコフ遷移モデルと状態空間モデルで述べられているように...?)。

私はもう少し正確な用語を使用していると思いますが、それでもすべてがぼやけています。誰でもHMMと状態空間モデルの違いは何ですか?

本当に自分のニーズに合った答えが見つからないからです。

もう一度ありがとう!


1
学校の図書館に次の本がある場合:crcpress.com/Time-Series-Modeling-Computation-and-Inference/…見てみましょう。私が言及するかもしれない3つのトピックすべてを説明するのに良い仕事をします。

残念ながら、ライブラリにこの本がないことを確認しただけです。ですから、私の質問に答えてくれると思われる部分を送ったり、これらのトピックを区別するのを手伝ってもらえたら嬉しいです!:)
user5584748

回答:


15

現在、標準の用語では2つのモデルが混在しているため、モデルとそれで作成したい推論を区別することが役立ちます。

モデルは、隠れた空間(離散または連続)、隠れた状態のダイナミクス(線形または非線形)、観測の性質(通常、条件付き多項または正規)、および接続する測定モデルの性質を指定する部分です。観測に対する隠された状態。HMMと状態空間モデルは、そのようなモデル仕様の2つのセットです。

tt

状態が連続的で、状態のダイナミクスと測定が線形で、すべてのノイズが標準である状況では、カルマンフィルターはその仕事を効率的に行います。状態が離散的な場合の類似物は、フォワードアルゴリズムです。非正規性および/または非線形性がある場合、近似フィルターにフォールバックします。決定論的な近似、たとえば拡張カルマンフィルターまたは無香料カルマンフィルターがあり、確率的近似があります。その中で最もよく知られているのはパーティクルフィルターです。

一般的な感覚は思わ観測中の状態や測定部品や非正規(一般的な問題の状況)、1回の試行では避けられない非直線性の存在下で可能な最も安い近似値と離れて取得することであることを。したがって、EKF、UKF、PF。

Unscented Kalmanフィルターに関する文献には、通常、Extended Kalmanフィルターの従来の線形化よりもうまく機能する可能性がある状況の比較がいくつかあります。

パーティクルフィルターは、ほぼ完全な一般性(非直線性、分布)を持っていますが、私の経験では、非常に慎重な調整が必要であり、一般的に他のものよりも扱いにくいです。ただし、多くの場合、これが唯一のオプションです。

さらに読むと、SärkkäのBayesian Filtering and Smoothingのch.4-7が好きですが、それはかなり簡潔です。著者は、個人的な使用のために利用可能なオンラインコピーを作成します。それ以外の場合、ほとんどの状態時系列の本はこの資料をカバーします。パーティクルフィルタリングについては、Doucet et al。トピックに関するボリュームが、私はそれが今かなり古いと思います。おそらく他の人が新しい参照を指摘するでしょう。


まず、答えてくれてありがとう。用語との一貫性と正確性を高めるために、上記の質問を編集したことを確認してください。私も質問全体を言い換えます。
user5584748

書き直しでは、「PFでは、隠された状態変数が連続的(実数値の隠された状態ベクトル)であり、観測値がガウス分布を持っている」ということはあまりありません。PFはフィルターです。フィルターの対象となるモデルは、連続状態空間(マルコフ構造など)を備えている必要がありますが、その他の点では制約がありません:分布、ダイナミクス、および測定プロセス。
共役

たとえば、PFを使用して、通常の線形ガウス状態空間モデルをフィルター処理できます。それはうまくいくでしょう。カルマンフィルターは正確なので、必要はありません。
共役

4
「HMMと状態空間モデルの違いは何ですか?」基本的に:慣例により、HMMには離散状態があります。また、慣例により、「状態空間モデル」は連続状態を持つものを示します。
共役

どうもありがとうございます!したがって、この違いは慣習によって(および参考文献によると)起こります。ただし、一般的には、どのモデルでも選択できます。あれは正しいですか?選択するモデルは、より良い結果が得られるかどうかによって異なりますか?
user5584748
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.