私のウェブサイトで詐欺広告を検出するためのアプローチを考え出そうとしています。詐欺を示す信号の多くは広告のテキスト内に見つかるので、問題はスパムメールの検出(多くの場合、単純なベイジアン分類器が一般的な解決策です)と多くの共通点があると思います。
ただし、他にも特定の詐欺インジケーターになる可能性のある情報がありますが、ベイズ分類器がそれらを使用できるかどうか/どのように使用できるかはわかりません。数値が関係しているためです(範囲の両端の値が疑わしいため)。テキスト内の単語の有無に対応する単純なバイナリ値よりも。
たとえば、多くの詐欺広告では、アイテムの価格が非常に低く設定されている(多くの視聴を引き付けるため)ので、広告が詐欺である可能性があることを示す強力な指標として、通常よりも低い価格を設定します。
ベイズはまだ私の要件に適していますか?そうでない場合は、別のアプローチをお勧めできますか?