科学者はどのようにして正しい隠れマルコフモデルのパラメーターとトポロジーを思い付きますか？

10

隠れマルコフモデルが、遺伝子の検索などのゲノムシーケンスでどのように使用されるかを理解しています。しかし、特定のマルコフモデルを考え出す方法がわかりません。つまり、モデルにはいくつの状態があるべきですか？可能な遷移はいくつありますか？モデルにループが必要ですか？

彼らは自分のモデルが最適であることをどのようにして知るのでしょうか？

彼らは、10の異なるモデルを想像し、それらの10のモデルをベンチマークして、最高のモデルを公開しますか？

machine-learning model-selection hyperparameter markov

— こんにちは世界
ソース

6

私は3つの主要なアプローチに精通しています。

アプリオリ。4つのベースペアから選択できることを知っているので、HMMに4つの状態を許可します。または、英語には44の音素があるため、音声認識モデルの非表示の音素レイヤーには44の状態があることを知っているかもしれません。
推定。状態の数は、多くの場合、おそらくHMMの観測された特徴の単純なクラスタリングによって事前に推定できます。HMM遷移行列が三角形の場合（これは、故障予測の場合によく見られます）、状態の数によって、開始状態から終了状態までの合計時間の分布の形が決まります。
最適化。あなたが提案したように、多くのモデルが作成されて適合し、最適なモデルが選択されます。HMMを学習する方法論を適応させて、モデルが必要に応じて状態を追加または破棄できるようにすることもできます。

— マシュー・グレイブス
ソース

1

さらなるアプローチは、数え切れないほどの数の状態を持つモデルからサンプリングすることです。サンプラーを平均することで、「いくつ」の答えが浮かび上がります。

— 予想
ソース