私は、ラプラシアン平滑化によるテキスト分類のための単純ベイズアルゴリズムを実装しています。私が抱えている問題は、多くの小さな分数を乗算しているため、確率がゼロに近づくことです。したがって、確率は最終的にゼロになります。これは、ドキュメントとトレーニングセット内にいくつかの単語があるためです。
このため、テキストを分類することができません。この問題を回避する方法はありますか?私の実装で何か問題がありますか?
...浮動小数点演算を回避できます。
msdn.microsoft.com/en-us/magazine/jj891056.aspx 簡単な答えがここにあります。
—
Roshan Mehta