カーネル密度の見積もりを計算するときにカーネルと帯域幅を選択する方法については、かなりの量の文献を見てきましたが、現在、任意の数のポイントで結果のKDE を評価するのにかかる時間を改善する方法に興味があります。
私の場合、私は対角共分散の多次元(2Dまたは3D)ガウスカーネルを使用しています(つまり、各次元は独立しています)。各次元の帯域幅は異なる場合があり、最近傍を使用して選択されます。ただし、私の質問はおそらく、異なるカーネルと帯域幅の選択方法に及んでいます。
のは、私が持っていると言うデータポイントとの結果としてKDEを評価したいNの格子点を。単純な実装では、多変量正規確率密度関数をM N回評価します。私の目的では、MとNはどちらも数千程度であり、評価が私のコードのボトルネックになっています。
この基本的な方法に一般に受け入れられている改善があるかどうかは知りません。複雑さをO (M N )からO (M + N )に減らすと主張するこの論文を見つけました。ただし、このメソッドは、私が知っている「標準の」RまたはPythonライブラリには実装されていません。これは、まだ広く採用されていないことを示唆していますか?
あなたが与えることができるすべてのポインタをありがとう。