タグ付けされた質問 「kde」

1
カーネル密度の解釈/使用
これは素朴な質問かもしれませんが、ここに行きます。経験的なデータのセットがあり、カーネル密度をそれに適合させ、元のデータセットを生成したプロセスと同じプロセスから新しい値を取得する場合、この新しい値がセットに属する確率を割り当てることができます/ processは、x軸の新しい値がカーネル密度線と交差し、密度線の下の領域で割るy軸から値を読み取るだけですか?
13 kde 

4
不確実性を組み込んだカーネル密度推定
1次元データを視覚化する場合、カーネル密度推定手法を使用して、不適切に選択されたビン幅を考慮するのが一般的です。 1次元データセットに測定の不確実性がある場合、この情報を組み込む標準的な方法はありますか? たとえば、KDEは観測のデルタ関数を使用してガウスプロファイルを畳み込みます。このガウスカーネルは各場所で共有されますが、ガウスパラメーターは測定の不確実性に合わせて変更できます。これを実行する標準的な方法はありますか?広いカーネルで不確実な値を反映したいと思っています。σσ\sigma 私はこれを単にPythonで実装しましたが、これを実行するための標準的なメソッドや関数を知りません。この手法に問題はありますか?奇妙な見た目のグラフが得られることに注意してください!例えば この場合、KDEは低い値(および不確実な値)に過剰な重みを付けますが、低い値はより大きな不確実性を持つため、広く平坦なカーネルを提供する傾向があります。

3
適応カーネル密度推定器?
誰もが適応カーネル密度推定器の経験について報告できますか? (多くの同義語があります:適応|変数|可変幅、KDE ​​|ヒストグラム|補間...) 可変カーネル密度推定で は、「サンプル空間の異なる領域でカーネルの幅を変更します。実際には2つの方法があります...」と言います。 multigrid ... もちろん、単一の方法ですべてを行うことはできませんが、適応的な方法は魅力的に見えます。 たとえば、有限要素法の適応2Dメッシュの見栄えを参照してください 。 実際のデータ、特に2Dまたは3Dで10万個以上の散在するデータポイントに対して、何が機能し、何が機能しなかったかを聞きたいです。 11月2日追加:「塊状」密度(区分的にx ^ 2 * y ^ 2)、最近傍推定値、およびスコット係数のガウスKDEのプロット。1つの例では何も証明されていませんが、NNが鋭い丘に適度にフィットできることを示しています(KD木を使用すると、2d、3dで高速です...)

4
Rでゼロに膨らんだパラメーターの密度をどのように推定できますか?
次のようなゼロの多いデータセットがあります。 set.seed(1) x <- c(rlnorm(100),rep(0,50)) hist(x,probability=TRUE,breaks = 25) 密度の線を描きたいのですが、density()関数はxの負の値を計算する移動ウィンドウを使用します。 lines(density(x), col = 'grey') density(... from, to)引数はありますが、次のプロットでわかるように、これらは計算を切り捨てるだけで、ウィンドウを変更せず、0での密度がデータと一致するように見えます。 lines(density(x, from = 0), col = 'black') (補間が変更された場合、黒い線は灰色の線よりも0の方が密度が高いと予想されます) ゼロでの密度のより良い計算を提供するこの関数の代替はありますか?
10 r  probability  kde 

1
カーネル密度推定器の簡単なサンプリング方法
私はJavaで単純なKernel Density Estimatorを開発しました。これは、数十ポイント(おそらく100程度まで)とガウスカーネル関数に基づいています。この実装により、任意の時点での確率分布のPDFおよびCDFが得られます。 このKDEに簡単なサンプリング方法を実装したいと思います。もちろん、KDEを構成するポイントのセットから描画するのが当然の選択ですが、KDEのポイントとは少し異なるポイントを取得できるようにしたいと思います。 これまでのところ、この問題を解決するために簡単に実装できる(数値積分や複雑な計算のための外部ライブラリに依存せずに)サンプリング手法を見つけていません。何かアドバイスは?精度や効率に関しては、特に強い要件はありません。私の主な関心事は、機能し、簡単に実装できるサンプリング機能を持つことです。ありがとう!
10 sampling  pdf  kde 

1
単純ベイズ分類器でのカーネル密度推定の使用?
この質問は、ここでの私の以前の質問のフォローアップであり、この質問に も意図的に関連しています。 このwikiページ 確率密度値のトレーニングセットについて想定正規分布からの実際の確率値よりベイズ事後むしろを計算するために使用されます。しかし、トレーニングセットが正規に分布していない場合、トレーニングセットのカーネル密度推定から取得した密度値を使用してベイジアン事後を計算することは同等に有効でしょうか? 目的のアプリケーションでは、このカーネル密度の推定は、MC手法によって生成された理論的に理想的な経験的データセットから取得されます。
9 bayesian  kde 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.