2つの分布間のHellinger距離の不偏推定量はありますか?


20

密度分布から分布観察する設定では、密度別の分布、すなわち 距離の不偏推定量(基づく)があるのだろうかX1,,XnX 、I 、F 0 HF F 0= { 1 - X fXif0

H(f,f0)={1Xf(x)f0(x)dx}1/2.

4
したがって、f0は既知であり、修正されています。しかし、fは既知であるか、パラメトリックファミリに属しているか、またはサンプルから得られるfについて知っているすべてを使用してノンパラメトリックフレームワークでこれを行っていますか?答えをしようとすると違いが出ると思います。
マイケルR.チェルニック

3
@MichaelChernick:について知っているのはサンプルだけだと仮定します。X 1X nfX1,,Xn
西安

2
(存在する場合)計算されたとは思わない。存在する場合、AICには失われた兄弟がいます。

4
この問題に対する攻撃は、とが離散的であると仮定した場合に実行可能に見えます。これにより、明らかな推定値が得られます(EDFと間のHellinger距離を計算し)。ブートストラップ(理論的には、シミュレーション経由ではありません!)は、可能なバイアスを処理し、バイアスを低減(または除去)する方法を提供します。距離そのものではなく、二乗距離で成功することを希望します。数学的には扱いやすいからです。離散の仮定は、アプリケーションでは問題ありません。とにかく、離散の空間は密なサブセットです。f 0 f 0ff0f0fff
whuber

2
の「正真正銘」の不偏推定量は存在しないというRosenblattの証明を思い浮かべます。それを克服し、H f f 0)の不偏推定量を取得できますか?知りません。fH(f,f0)

回答:


5

適度に広いノンパラメトリッククラスの分布からのfについて、またはH 2のどちらの不偏推定量も存在しません。HH2f

これを美しくシンプルな引数で示すことができます

Bickel and Lehmann(1969)。凸族の偏りのない推定。数理統計学、40(5)1523–1535。(プロジェクトeuclid

対応する密度f 0f、およびgで、いくつかの分布F、およびGを修正します。LET H F 示すHF F 0、およびlet HXはいくつかの推定であるH F に基づいてN個の IIDサンプルX IFをF0FGf0fgH(F)H(f,f0)H^(X)H(F)nXiF

仮定Hは、フォームの任意の分布からのサンプルについて、公正である M α= α F + 1 - α G しかし、その後 Q α H^

Mα:=αF+(1α)G.
その結果Qαはでなければならない多項式αの高々度のn
Q(α)=H(Mα)=x1xnH^(X)dMα(x1)dMα(xn)=x1xnH^(X)[αdF(x1)+(1α)dG(x1)][αdF(xn)+(1α)dG(xn)]=αnEXFn[H^(X)]++(1α)nEXGn[H^(X)],
Q(α)αn

それでは、合理的なケースに特化して、対応するが多項式ではないことを示しましょう。Q

LET で一定の密度を有するいくつかのディストリビューションである[ - 1 1 ]F 0X = C全てについて| x | 1。(その動作範囲外は関係ないこと)レッツFは、いくつかの分布でのみサポートされ、[ - 1 0 ]、及びG一部分布でのみサポート[ 0 1 ]F0[1,1]f0(x)=c|x|1F[1,0]G[0,1]

BF=R

Q(α)=H(mα,f0)=1Rmα(x)f0(x)dx=110cαf(x)dx01c(1α)g(x)dx=1αBF1αBG,
のために、同様にBG。密度を持つ分布FGについては、BF>0BG>0であることに注意してください。BF:=Rf(x)f0(x)dxBGBF>0BG>0FG

任意の有限次数の多項式ではありません。したがって、いかなる推定量 Hは、のために公平になることはできませんH分布の全てにMのα有限個のサンプルを有します。1αBF1αBGH^HMα

同様に、また、多項式ではない、のための推定がない H 2分布の全てに公平であるMのα有限個のサンプルを有します。1αBF1αBGH2Mα

これは、以下の範囲の密度を持つものを除き、ほとんどすべての合理的な分布のノンパラメトリッククラスを除外します(ノンパラメトリック分析が仮定することがあります)。密度を一定にするなどして、同様の引数でこれらのクラスを殺すこともできます。


13

f0X1,,Xnf>0

H(f,f0)=1Xf(x)f0(x)dx=1Xf0(x)f(x)f(x)dx
=1E[f0(X)f(X)],
Xf
11ni=1nf0(Xi)f(Xi)H(f,f0),
nH(f,f0)fn^f
H^=11ni=1nf0(Xi)fn^(Xi).

3
HH^n2E[(f0(X)/f(X))2]=1

1
推定量の西安の分散について説明してくれてありがとう!

2
kff0f0
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.