カーネル密度の推定を行う場合、少なくとも理論的な意味では、Epanechnikovカーネルが最適であることを(たとえば、ここで)読みました。これが本当なら、なぜガウス分布は密度推定ライブラリでデフォルトのカーネル、または多くの場合唯一のカーネルとして頻繁に表示されるのですか?
カーネル密度の推定を行う場合、少なくとも理論的な意味では、Epanechnikovカーネルが最適であることを(たとえば、ここで)読みました。これが本当なら、なぜガウス分布は密度推定ライブラリでデフォルトのカーネル、または多くの場合唯一のカーネルとして頻繁に表示されるのですか?
回答:
Epanechnikovカーネルが理論上の最適性のために普遍的に使用されない理由は、Epanechnikovカーネルが実際に理論的に最適ではないためです。Tsybakovは、ノンパラメトリック推定入門(セクション1.2.4)の16〜19ページで、Epanechnikovカーネルが「理論的に最適」であるという議論を明示的に批判しています。
要約すると、カーネルと固定密度いくつかの仮定の下で、平均積分平方誤差は、
Tsybakovの主な批判は、非負カーネルに限定することなく、非負であってもより良いパフォーマンスの推定値を取得できることが多いため、非負カーネルを最小化することです。
Epanechnikovカーネルの引数の最初のステップは、をおよびすべての非負カーネル(より広いクラスのすべてのカーネルではなく最小化し、「最適な」帯域幅を取得することから始まります
および「最適な」カーネル(Epanechnikov)
その平均積分二乗誤差は:
ただし、これらは未知の密度知識(を介して)に依存するため、実行可能な選択肢ではありません。したがって、「オラクル」の量です。
Tsybakovによって与えられた命題は、Epanechnikov oracleの漸近的MISEは次のことを意味します。
Tsybakovは、(2)は、多くの場合、最良の達成可能MISEであることを主張したが、その後1注文2(のためのカーネルを使用できることを示していると言いすべてのために、カーネル推定量を構築するために)は、そのようなことを
にもかかわらず、必ずしも非負ないものはまだ、正の部分の推定のために同じ結果を有するすることが保証されています(が非負であっても負でない):
したがって、のために十分に小さい、そこに存在する真の推定 Epanechnikovのより小さい漸近MISE持って神託をしても、未知の密度で同じ仮定使用し。
特に、すべてのカーネル推定量(またはカーネル推定量の正の部分)に対する固定漸近MISEの下限はです。したがって、Epanechnikov oracleは、真の推定量と比較した場合でも、最適であるとは言えません。
そもそもエパネチニコフ神託の議論を進めた理由は、密度自体が非負であるため、カーネル自体が非負であるべきだとしばしば主張するからです。しかし、Tsybakovが指摘しているように、非負の密度推定量を得るためにカーネルが非負であると仮定する必要はありません。他のカーネルを許可することで、(1) (2)固定について、エパネチニコフ神託よりも勝手に優れている。Tsybakovは、それが固定の面で最適のために主張しても意味がないことを主張するために、この矛盾を使用しだけの上に均一で最適の性質のために、クラス密度の。彼はまた、MISEの代わりにMSEを使用する場合でも引数が機能することを指摘しています。
編集:系譜1.1も参照してください。p.25では、別の基準に基づいてエパネニコニコカーネルが許容できないことが示されています。Tsybakovは、Epanechnikovカーネルが本当に好きではないようです。
ガウスカーネルは、たとえば微分による密度推定で使用されます。
これは、無限に多くの(非ゼロ)導関数を持つガウスとは異なり、Epanechnikovカーネルにはゼロになる前に3つの導関数があるためです。他の例については、リンクのセクション2.10を参照してください。
kdensity
。