トレーニングデータセットがあり、その上でNaive Bayes Classifierをトレーニングし、確率がゼロの属性値がある場合。後で新しいデータの分類を予測する場合、これをどのように処理しますか?問題は、計算にゼロがある場合、他の解を見つける可能性のある他の値をいくつ取得しても、製品全体がゼロになることです。
例:
トレーニングデータでは、TimeZone US属性が小さなトレーニングデータセットで常にYesであるため、製品全体がなります。どうすればこれを処理できますか?より大きなトレーニングデータセットを使用する必要がありますか、またはこの問題を克服する別の可能性がありますか?
離散的な属性値が発生する場合、その確率は定義上ゼロにすることはできません。
—
ポール
なぜ1対0の周波数の問題を追加するのか、この背後にあるロジックとは何か、なぜ別の数値を追加しないのか。
—
アフタブフセイン