可変カーネルは、ローカル回帰でよく使用されます。たとえば、黄土は広く使用されており、回帰スムーザーとして機能し、データのスパース性に適応する可変幅のカーネルに基づいています。
一方、変数カーネルは通常、カーネル密度推定の推定量が不十分になると考えられています(Terrell and Scott、1992を参照)。
密度推定ではなく回帰ではうまく機能するという直感的な理由はありますか?
可変カーネルは、ローカル回帰でよく使用されます。たとえば、黄土は広く使用されており、回帰スムーザーとして機能し、データのスパース性に適応する可変幅のカーネルに基づいています。
一方、変数カーネルは通常、カーネル密度推定の推定量が不十分になると考えられています(Terrell and Scott、1992を参照)。
密度推定ではなく回帰ではうまく機能するという直感的な理由はありますか?
回答:
ここには2つの異なる質問があるようです。それらを分割してみます。
1)KS、カーネル平滑化、KDE、カーネル密度推定との違いは何ですか?まあ、私は推定器/スムーザー/補間器を持っていると言います
est( xi, fi -> gridj, estj )
また、xiで「実際の」densityf()を知ることもあります。次に、実行
est( x, densityf )
するとdensityf()の推定値、KDEが得られます。KSとKDEの評価は異なる場合があります(異なる平滑化基準、異なる基準)が、根本的な違いは見当たりません。私は何が欠けていますか?
2)次元は推定または平滑化に直感的にどのように影響しますか?直感を助けるために、おもちゃの例を示します。均一なグリッド内のN = 10000ポイントのボックスと、その中のW = 64ポイントのウィンドウ、ライン、正方形、またはキューブを考えてみましょう。
1d 2d 3d 4d
---------------------------------------------------------------
data 10000 100x100 22x22x22 10x10x10x10
side 10000 100 22 10
window 64 8x8 4x4x4 2.8^4
side ratio .64 % 8 % 19 % 28 %
dist to win 5000 47 13 7
ここで、「サイド比」はウィンドウ側/ボックス側であり、「勝つまでの距離」は、ランダムに配置されたウィンドウまでのボックス内のランダムポイントの平均距離の概算です。
これはまったく意味がありますか?(画像またはアプレットが本当に役立ちます:誰ですか?)
固定サイズのボックス内の固定サイズのウィンドウは、1d 2d 3d 4dのボックスの残りの部分と非常に異なる近さを持つという考え方です。これは均一なグリッド用です。次元への強い依存が他の分布に引き継がれるかもしれませんが、そうではないかもしれません。とにかく、それは強い一般的な効果、次元の呪いの側面のように見えます。
カーネル密度推定とは、ローカル(ファジー)ウィンドウでの統合を意味し、カーネル平滑化とは、ローカル(ファジー)ウィンドウでの平均化を意味します。
カーネル平滑化: 。
カーネル密度推定: 。
これらはどのように同じですか?
ブール値関数のサンプル、つまり、「真のサンプル」(それぞれ単位値を持つ)と「偽のサンプル」(それぞれゼロ値を持つ)の両方を含むセットを考えてください。全体的なサンプルの密度は(格子状)に一定であると仮定すると、この関数の局所平均である同じ真値の部分集合の局所的な(部分)の密度に比例します。(偽サンプルにより、平滑化方程式の分母を常に無視することができますが、合計にゼロ項が追加されるため、密度推定方程式が単純化されます。)
同様に、サンプルがブールラスター上のスパース要素として表されている場合、ラスターにぼかしフィルターを適用することでサンプルの密度を推定できます。
これらはどう違いますか?
直観的には、平滑化アルゴリズムの選択は、サンプル測定に重大な測定誤差が含まれているかどうかに依存することが予想されます。
極端な場合(ノイズなし)、サンプル位置で正確に既知の値の間を補間するだけです。Delaunayの三角形分割(双線形の区分的補間を使用)で言います。
密度推定は反対の極端に似ています。それは完全にノイズです。孤立したサンプルには、その時点での密度値の測定が含まれていないためです。(したがって、単純に補間するものは何もありません。ボロノイ図のセル領域の測定を検討することもできますが、平滑化/ノイズ除去は依然として重要です。)
ポイントは、類似性にもかかわらず、これらは根本的に異なる問題であるため、異なるアプローチが最適である可能性があるということです。