中央値の不偏推定値


16

サポートされているランダム変数があり、そこからサンプルを描画できるとします。の中央値の不偏の推定値をどのように考え出すことができますか?[ 0 1 ] XX[0,1]X

もちろん、いくつかのサンプルを生成してサンプルの中央値を取得することもできますが、これは一般的に公平ではないことを理解しています。

注:この質問は、最後の質問に関連していますが同一ではありません。この場合、はおおよそのサンプリングしかできません。X

回答:


13

そのような推定量は存在しません。

直観は、中央値が固定されたままで、確率密度を両側で自由にシフトできるため、平均値が1つの分布の中央値である推定量は、変更された分布に対して異なる平均を持ち、バイアスがかけられるということです。次の説明では、この直感をもう少し厳密に説明しています。


定義により、すべてのおよびとなるように、一意の中央値を持つ分布注目します。サンプルサイズを修正し、推定と仮定します。(制限するだけで十分ですが、通常は明らかに不可能な値を生成する推定量を真剣に考慮しません。)については何も仮定しません。どこでも連続である必要さえありません。M F M 1 / 2 F X < 1 / 2 X < M N 1 T [ 0 1 ] のn[ 0 1 ] M TFmF(m)1/2F(x)<1/2x<mn1t:[0,1]n[0,1]mtt

(この固定サンプルサイズに対して)が不偏でことの意味は、t

EF[t(X1,,Xn)]=m

iidサンプルの場合。「不偏推定量」は、このようなすべてのに対してこのプロパティを持つものです。T FXiFtF

不偏推定量が存在すると仮定します。矛盾を特に単純な分布のセットに適用することにより、矛盾を導き出します。次の特性を持つ分布を考えます。F=Fx,y,m,ε

  1. 0x<y1 ;

  2. 0<ε<(yx)/4 ;

  3. x+ε<m<yε ;

  4. Pr(X=x)=Pr(X=y)=(1ε)/2 ;

  5. Pr(mεXm+ε)=ε ; そして

  6. [ M - ε M + ε ]Fは均一です。[mε,m+ε]

これらの分布は、確率をとそれぞれに配置し、わずかな量の確率がと間の周りに対称的に配置されます。これにより、はの一意の中央値になります。(これが連続分布ではないことが心配な場合は、非常に狭いガウスで畳み込み、結果を切り捨てます。引数は変更されません。)X 、Y 、M 、X 、Y 、M 、F [ 0 1 ](1ε)/2xymxymF[0,1]

さて、推定中央値推定器について、は値の平均のここで、はとすべての可能な組み合わせで変化します。ただし、と間でを変更できます。これは、少なくとも変更です(条件2および3により)。したがって、が存在し、そこから対応する分布E [ T X 1X 2... X N] ε 2 N T X 1はxは2... XのN、X I、X 、Y 、M X + ε Y - ε ε M Fは、xはYをm εtE[t(X1,X2,,Xn)]ε2nt(x1,x2,,xn)xixymx+εyεεmFx,y,m,ε、この期待値は中央値QEDと等しくありませ


(+1)すてきな証拠。あなたはそれを思いつきましたか、それはあなたが大学院で覚えていたものですか?
StasK

4
もう1つの証拠があります。ほとんどのベルヌーイ確率変数の中央値はまたはです。推定試行のみの頂点上の推定の平均値に依存すると、及びこれらの平均値の重みが多項式である程度。これは不偏推定量である場合、それは平均値有していなければならない任意用、以上あるのような値、この多項式が一定でなければならない...それはでなければならないので、に値が低いので、そこにも偏りがありません。1 N [ 0 1 ] N、K 、P 、N 1 、P > 1 / 2 N + 1 、P 0 、P01n[0,1]nkpn1p>1/2n+1p0p
ダグラスザーレ

1
@ダグラスそれは素晴らしい証拠です。ただし、ベルヌーイ変数の中央値はやや特別であり、2つのサポートポイントの1つと一致するため( 1/2の場合を除く)、一部の人々はその適用範囲について少し不安を感じるかもしれません。読者は、これを「病理学的」と宣言し、ドメインのどこでも正の密度の連続分布のみを見て、そのようなモンスターを阻止しようとするかもしれません。そのような努力が失敗することを示すように注意したのはそのためです。p=1/2
whuber

3

パラメトリックモデルを持たずに公平な推定量を見つけることは困難です。ただし、ブートストラップを使用し、これを使用して経験的中央値を修正し、ほぼ不偏の推定量を取得できます。


これが不可能な場合、それを証明することは可能ですか?たとえば、Xから独立したサンプルである場合、f X 1X nfの選択に対して不偏でないことを証明できますか?X1,X2,,XnXf(X1,,Xn)f
ロビンソン

2
kjetilは、ノンパラメトリックフレームワークでは、あらゆる可能な分布に対して公平な推定値を与える方法はないと言っていると思います。しかし、パラメトリックフレームワークではおそらく可能です。バイアスされたサンプル推定値のブートストラップにより、バイアスを推定し、それを調整して、ほぼバイアスのないブートストラップ推定値を取得できます。それは、ノンパラメトリックフレームワークで問題を処理するための彼の提案でした。公平な推定が不可能であることを証明することも困難です。
マイケルR.チャーニック

2
偏りのない推定量が存在しないことを本当に証明したい場合は、Ferguson: "Mathematical Statistics-A Decision Theoretic Approach"という本があります。
kjetil bハルヴォルセン

ブートストラップの規則性の条件は、whuberが彼の答えで考慮している分布関数に違反することを想像します。マイケル、コメントできますか?
StasK

2
@Stas先ほど指摘したように、私の機能は、それらを緩和することで非常に「素敵」に見せることができます。また、原子の大きな有限混合物の緩和に一般化することもできます。このような分布のクラスは、単位間隔のすべての分布で密集しているため、ここではブートストラップの規則性が関係するとは思いません。
whuber

0

分位点回帰は、中央値の一貫した推定量を提供すると考えています。モデル与えられた場合。また、αは定数であるため、med y = med α + u = α + med u を推定します。必要なのは、med u = 0だけです。これは、独立したドローがある限り真になります。しかし、公平性に関してはわかりません。中央値は難しいです。Y=α+あなたはmedy=medα+あなたは=α+medあなたはαmedあなたは=0


@whuberの回答
Peter Flom-
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.