非対称分布のカーネル密度推定


10

ましょう不明(確かに非対称)確率分布から引き出される観測。{バツ1バツN}

私はKDEのアプローチを使用して確率分布を見つけたい ただし、ガウスカーネルを使用しようとしましたが、対称であるため、パフォーマンスが低下しました。したがって、ガンマカーネルとベータカーネルに関するいくつかの作業がリリースされたことがわかりましたが、それらの操作方法はわかりませんでした。

f^バツ=1NhΣ=1NKバツバツh

私の質問は次のとおりです。基礎となる分布のサポートが区間でないとすると、この非対称のケースを処理する方法を[01]


4
lognormalに近い密度の場合(一部の特定のアプリケーションでよく発生します)、単純に変換し(ログを取得して)、次にKDEを実行してから、KDEを再変換します(変換時にヤコビ行列を覚えておく必要があります)見積もりを戻します)。その場合、それは非常にうまく機能します。
Glen_b-2013

@Glen_bこの方法が説明されている参考資料や資料はありますか?(元の変数の変換でKDEを計算してからKDEを変換し直す)
boscovich '25年

私が知っているわけではありません-それらはかなり些細なアイデアであり、簡単に実装できるため、存在すると確信しています。それは私が統計学部生が導き出すことができると私が期待するようなものです。実際には非常にうまく機能します。
Glen_b-モニカを2013

@glen_bありがとう。それで、もし私がそれをテクニカルレポート/出版物で使用するなら、あなたは何の言及もしなくてもいいと思いますか?
boscovich 2013年

1
@guy特に変換やデータの種類によっては、問題が発生する可能性があります。私が使用した状況は対数正規にかなり近い傾向があり、問題として見られる帯域幅の変化がまさに必要なものです。生データのKDEよりもはるかに優れています。OPの説明から、それはかなり似ているように思われましたが、万能薬であると示唆していたようではありません。
Glen_b-2013

回答:


5

まず、対称カーネルを使用したKDEは、データが非対称の場合にも非常にうまく機能します。そうでなければ、実際にはそれは完全に役に立たないでしょう。

ログバツ


に再スケーリングする場合log(x)、ヤコビアンも考慮する必要がありますか?
DilithiumMatrix、

0

うーん。場所の関数として変化するカーネル幅が必要になる場合があります。

eCDFの問題を調べている場合は、CDFの数値勾配をカーネルサイズに関連付けるようにしてみます。

座標変換を行う場合は、始点と終点をかなりよく理解する必要があると思います。ターゲットの分布がよくわかっている場合は、カーネル近似は必要ありません。


1
私は自分のRVが負ではないことを非常に簡単に知ることができましたが、それでもKDEが必要です。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.