隠れマルコフモデルで「最適な」モデルを選択するための基準


12

データの潜在状態の数を推定するために、隠れマルコフモデル(HMM)を近似しようとする時系列データセットがあります。これを行うための私の擬似コードは次のとおりです。

for( i in 2 : max_number_of_states ){ 
    ...
    calculate HMM with i states
    ...
    optimal_number_of_states = "model with smallest BIC"
    ...
}

さて、通常の回帰モデルでは、BICは最もpar約的なモデルを好む傾向がありますが、HMMの場合、それが何をしているのかわかりません。BIC基準がどのようなHMMの傾向があるのか​​を実際に知っている人はいますか?また、AICと尤度値も取得できます。州の真の総数を推測しようとしているので、これらの基準の1つは、この目的のために他の基準よりも「優れている」のでしょうか。

回答:


11

ここでは、出力変数がカテゴリカルであると仮定していますが、そうでない場合もあります。ただし、通常、HMMの使用を見たときに、チューニングによって選択されるのではなく、状態の数が事前にわかっています。通常、それらは観測されないことがよく知られているいくつかのよく知られた変数に対応します。しかし、それはあなたがそれを実験できないという意味ではありません。

BIC(およびAIC)を使用して危険性は、しかしであるk個の P状態についてあなたはPxを有する遷移確率行列を持っているので、状態数(P-1)のパラメータ(と二次モデルが増大する自由パラメータの数の値)および各状態での出力の各カテゴリの出力確率。したがって、AICとBICが適切に計算されている場合、kは速く上昇するはずです。

十分なデータがある場合は、ホールドアウトサンプルのテストなど、状態の数を調整するよりソフトな方法をお勧めします。また、尤度統計を見て、それがプラトーになるポイントを視覚的に確認することもできます。また、データが大きい場合は、BICをより小さなモデルにプッシュすることに注意してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.