回答:
私は3つの主要なアプローチに精通しています。
アプリオリ。4つのベースペアから選択できることを知っているので、HMMに4つの状態を許可します。または、英語には44の音素があるため、音声認識モデルの非表示の音素レイヤーには44の状態があることを知っているかもしれません。
推定。状態の数は、多くの場合、おそらくHMMの観測された特徴の単純なクラスタリングによって事前に推定できます。HMM遷移行列が三角形の場合(これは、故障予測の場合によく見られます)、状態の数によって、開始状態から終了状態までの合計時間の分布の形が決まります。
最適化。あなたが提案したように、多くのモデルが作成されて適合し、最適なモデルが選択されます。HMMを学習する方法論を適応させて、モデルが必要に応じて状態を追加または破棄できるようにすることもできます。
さらなるアプローチは、数え切れないほどの数の状態を持つモデルからサンプリングすることです。サンプラーを平均することで、「いくつ」の答えが浮かび上がります。