(私は統計の初心者です。私は数学者でプログラマーであり、単純なベイジアンスパムフィルタのようなものを構築しようとしています。)
多くの場所で、人々はベイズの定理の方程式の分母を分解する傾向があることに気付きました。したがって、これの代わりに:
これが提示されます:
このウィキペディアの記事と、Tim Petersによるこの洞察に満ちた投稿で、この規則が使用されていることがわかります。
私はこれに困惑しています。分母がなぜこのように分解されるのですか?それは物事をどのように助けますか?スパムフィルターの場合、計算するのにそれほど複雑なのは何ですか?The probability that the word "cheese" appears in an email, regardless of whether it's spam or not