クラスタリングの問題を解決するためにベイズを使用しています。いくつかの計算を行った後、2つの確率の比率を取得する必要があります。
を取得できるようにします。これらの確率は、この回答で説明されているように、2つの異なる2D多変量KDEの統合によって得られます。
ここで、およびはKDEであり、しきい値および。両方のKDEはガウスカーネルを使用します。私が作業しているものに似たKDEの代表的な画像をここで見ることができます:2Dでのカーネル密度推定量の統合。
python
関数stats.gaussian_kdeを使用してKDEを計算するため、次の一般的な形式を想定しています。
ここn
で、ポイントの配列の長さとh
使用される帯域幅です。
上記の積分は、モンテカルロプロセスを適用して計算されますが、これは非常に計算コストがかかります。このようなケースでは、確率の比率をしきい値ポイントで評価されたPDF(KDE)の比率で置き換えて、同等の有効な結果を得ることができることをどこかで読みました(場所を忘れてしまった、申し訳ありません)。KDEs比の計算は、MCとの積分比の計算よりも桁違いに速いため、これに興味があります。
したがって、問題はこの式の妥当性に限定されます。
どのような状況下で、もしあれば、この関係が真実であると言えますか?
[誤字修正(編集)]
追加:
ここだ基本的に同じ質問が、よりに作られた数学的なフォーム。
P(X)
計算を避けようとしているものの値を知っていることが明らかに必要です。そのパラメーターの関連性について少し詳しく教えてください。