感情分析のタスクとして、で表されるクラスと機能とします。
各クラスの条件付き確率は次のように表すことができます ここで、は各特徴を表し、はクラスです我々は持っています。次に、経験的に、 ことができます。ここで:
は、すべてのクラスの特徴の総数です。
は、クラスその特徴カウント数を表し。
は、クラスの機能の総数です。
は、すべてのクラスの機能の総数です。
上記の私の理解は正しいですか?したがって、各単語のこれらの確率を考えると、私は単純なベイズの仮定です。単語は独立しているため、特定のクラスのドキュメントの各単語を単純に乗算します。つまり、ここで、はドキュメント内の単語数です。これは正しいです?
条件付き確率を数値で実際に計算するには、次のことを行えば十分でしょうか。
方程式の最後の部分は、かなり複雑な確率を計算するには単純すぎるように思えるため、私には少し疑わしく見えます。