隠れマルコフモデルとマルコフ遷移モデルと状態空間モデル…?


18

修士論文では、血清学的状態によって定義される異なる状態間の遷移の統計モデルの開発に取り組んでいます。私の質問はより一般的/理論的であるため、今のところ、このコンテキストにあまり多くの詳細を説明しません。とにかく、私の直感では、隠れマルコフモデル(HMM)を使用する必要があります。モデルを作成するために必要な文献やその他の背景研究を経て遭遇する問題は、用語と、さまざまなタイプの隠れたプロセスモデル間の正確な違いに関する混乱です。私はそれらを区別するもの(今後の例)を非常に漠然としか認識していません。さらに、少なくとも私が文献で見たものから、このタイプのモデリングの周りに構築された非常に非標準的な語彙があるように思えます。

だから、私は人々が私のためにこれらの用語のいくつかを明確にするのを手伝ってくれることを望んでいた。いくつか質問がありますが、1つまたは2つの回答が満足のいくものになると、残りは結果として解き明かされると思います。これが長すぎないことを願っています。モデレーターがこれを複数の投稿に分割することを望んでいる場合、私はそうします。いずれにせよ、質問を太字で示し、続いて文献検索中に明らかにした質問の詳細を記載しました。

したがって、順不同で:

1)「非表示プロセスモデル」とは正確には何ですか?

私は、「隠されたプロセスモデル」はいくつかの異なるタイプの統計モデルを記述するために使用できる一種の包括的な用語であり、すべてが「オーバーラップのシステムによって生成された時系列データ潜在的に隠された線形加算プロセス」([1])。実際、[2]は「隠れたプロセスモデル」を「状態空間モデルまたは隠れマルコフモデルのいずれかを指す一般用語」として定義しています。[1]は、隠れマルコフモデルが、バイナリ状態の推論に特化した隠れプロセスモデルのサブタイプであると推測しているようです。基本的な意味は、隠れたプロセスモデルは隠れたマルコフモデルの一般化であると思われます。「隠れたプロセスモデル」と「

私のこの直感は正しいですか?そうでない場合、これらの方法をより明確に説明するリファレンスがありますか?

2)隠れマルコフモデルと状態空間モデルの違いは何ですか?

再び[2]に戻ります(紙自体が特に信頼できるように見えるためではなく、紙に明確な用語集が付いている場合だけです;それは一文の定義の便利な情報源にすぎません)、違いはそうです隠れマルコフモデルは、状態がマルコフである特定のタイプの状態空間モデルです(マルコフプロセスの順序に明確な制限はないようです。つまり、1次、...、k次)。ここで、状態空間モデルは、「2つの時系列を並行して実行するモデルであり、1つは真の状態(潜在)のダイナミクスをキャプチャし、もう1つはこれらの基礎となる可能性のある未知の状態から行われる観測で構成される」と定義されます。それらの状態がマルコフ特性も示す場合、それは隠れマルコフモデルです。

ただし、[3]は、状態空間モデルと隠れマルコフモデルの違いを、潜在状態の特性に関連するものとして定義しています。ここで、隠れマルコフモデルは離散状態を扱い、状態空間モデルは連続状態を扱います。それ以外の場合、概念的には同じです。

これらは非常に異なる2つの定義のように思えます。一方では、隠れマルコフモデルは状態空間モデルのサブタイプであり、他方では、両方とも、より広範なクラスの隠れプロセスモデルの異なるインスタンス化です。これらのうち正しいものはどれですか?私の直感では、[2]とは対照的に[3]に従うように指摘していますが、これをサポートする信頼できる情報源は見つかりません。

3)「マルコフ遷移モデル」とは何ですか?

多くのソースで出てきた別の用語は、「Markov遷移モデル」です。私はどの教科書にもこのフレーズを見つけることができませんでしたが、ジャーナルの記事には多く見られます(単に確認のためにGoogleに接続するだけです)。私はこの用語の厳密な定義を見つけることができませんでした(私が見つけたすべての論文は別の論文を引用し、他の論文を引用するなど、どこにも正気をもたらさないPubMedウサギの穴を送ります)。コンテキストからの私の印象は、推論の対象がマルコフ過程に従う状態間の遷移であるモデルを指す非常に一般的な用語であり、隠れマルコフモデルはマルコフ遷移モデルの特定のタイプと見なされる可能性があるということです。[4]しかし、遷移モデル、隠れマルコフモデル、およびいくつかの同様の用語を互換的に使用しているようです。

一方、[5]はマルコフ遷移モデルと隠れマルコフモデルについて少し異なった話をしています。著者は、「遷移モデルは、より複雑な隠れマルコフモデルからの結果を解釈するのに役立つ回答者のダイナミクスを要約する方法を提供します」と述べています。私はこのフレーズが何を意味するのか完全には理解しておらず、論文の他の場所でそれを正当化するものを見つけることができません。しかし、彼らはマルコフ遷移モデルは時間を連続変数として使用し、隠れマルコフモデルは時間を離散変数として使用することを暗示しているようです(彼らはこれを直接言わず、彼らはマルコフ遷移に適合するためにRパッケージ 'msm'を使用すると言います)モデル、および「msm」は、HMMのRパッケージとは対照的に、継続的に時間を処理するものとして説明されています)。

4)他の概念、たとえば動的ベイジアンネットワークはどこに収まりますか?

ウィキペディアによると、動的ベイジアンネットワークは「隠れマルコフモデルとカルマンフィルターの一般化」です。他の場所では、「世界の全状態が単一の隠れ状態変数によって表される」動的ベイジアンネットワークの特別なケースとして定義された隠れマルコフモデルを見ました(動的ベイジアンシステムの定義とHMMとの関係?) 。私は一般にこの関係を理解し​​ており、[6]で十分に説明されています。

しかし、私はこの関係が物事のより広い視野にどのように適合するかを理解するのに苦労しています。つまり、HMMとDBNの間のこの関係を考えると、状態空間モデルと隠れたプロセスモデルはどのように2つに関連していますか?隠れマルコフモデルの複数の「一般化」があるように思われる場合、これらの異なるタイプの方法はすべてどのように相互に関係しますか?


参照:

[1]トム・M・ミッチェル、レベッカ・ハッチンソン、インドラヤナ・ルスタンディ。「非表示プロセスモデル」。2006. CMU-CALD-05-116。カーネギーメロン大学。

[2]オリバー・ギミネス、ジャン・ドミニク・レブルトン、ジャン・ミシェル・ガイヤール、レミ・ショケ、ロジャー・プラデル。「隠れたプロセスの動的モデルを使用した人口統計パラメーターの推定」。理論人口生物学。2012. 82(4):307-316。

[3]バーバラエンゲルハルト。「隠れマルコフモデルと状態空間モデル」。STA561:確率的機械学習。デューク大学。http://www.genome.duke.edu/labs/engelhardt/courses/scribe/lec_09_25_2013.pdf

[4] Jeroen K. Vermunt。「歩行気分評価データの分析への応用による連続時間でのマルチレベル潜在マルコフモデリング」。社会統計ワークショップ。2012.ティルブルフ大学。http://www.lse.ac.uk/statistics/events/SpecialEventsandConferences/LSE2013-Vermunt.pdf

[5]ケン・リチャードソン、デビッド・ハート、クリスティー・カーター。「健康と労働力の移行を理解する:マルコフモデルをSoFIE縦断データに適用する」。公式統計調査シリーズ。2012年。

[6]ゾウビン・ガラマーニ。「隠れマルコフモデルとベイジアンネットワークの紹介」。Journal of Pattern Recognition and Artificial Intelligence。2001. 15(1):9-42。


リカレントニューラルネットワークを試してみることもできます。音声認識では、HMMの代替としてそれらを正常に使用している人もいます。
アルバート

ご提案ありがとうございます。現時点では、これらの手法に関する私の質問を明確にしてから、新しい手法の研究に移りたいと考えています。
ライアンシモンズ

それらは同じものを指します。scholarpedia.org/article/State_space_model Sangdon

2
@Ryan Simmons youtubeでmarkovチェーンと隠されたmarkovモデルについてのmathericalmonk(別名Jeffrey Miller)のビデオをチェックするのは良い考えだと思います。
ジムボーイ

おそらく今までに論文を提出しているので、この質問に自分で答えてくれませんか?私はここで専門家に答えて欲しいと思いますが、これはおそらくこの質問を読んだ800人近くの他の人にも当てはまります。
ウルフアスラク

回答:


4

以下は、Scholarpedia Webサイトから引用されています

状態空間モデル(SSM)は、潜在状態変数と観測された測定値の間の確率的依存性を記述する確率的グラフィカルモデル(Koller and Friedman、2009)のクラスを指します。状態または測定は、連続または離散のいずれかです。「状態空間」という用語は、1960年代に制御工学の分野で生まれました(カルマン、1960)。SSMは、確率論的プロセスを通じて測定または観測される決定論的および確率論的な動的システムを分析するための一般的なフレームワークを提供します。SSMフレームワークは、工学、統計、コンピューターサイエンス、および経済学にうまく適用され、広範囲の動的システムの問題を解決しています。SSMの説明に使用される他の用語は、隠れマルコフモデル(HMM)(Rabiner、1989)および潜在プロセスモデルです。最もよく研​​究されているSSMはカルマンフィルターです。


3

私とアラン・ホークスは、連続時間で離散状態を持つマルコフ過程の集約について多くのことを書いています。私たちのものは、単一のイオンチャネル分子の観察結果を解釈する問題に関するもので、見逃された短いイベントの正確な処理が含まれています。同様の理論は信頼性理論でも機能します。それは他の問題にうまく適応するかもしれません。リファレンスについては、http://www.onemol.org.uk/?page_id = 175を参照してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.