サンプルの分位バイアスの実証

8

いくつかのシミュレーションを行っているときに、サンプルの分位点が真の分位点の偏った推定量であることに気付きました。そして、私のシミュレーションによると、潜在的に非常に偏ったものです。

経験的なCDFは偏っていないのでその結果には驚きましたが、インターネットでの調査の結果、それが本当であることがわかりました。

私はそのバイアスがどこから来ているのかを理解しようとしましたが、サンプル分位点を扱うことは非常に困難です。だれかがそのバイアスの実証（そして理想的には定量化）を持っていますか？

estimation quantiles

— トーマス
ソース

2

ECDFはcdfに偏りがありませんが、ECDFからサンプルの変位値にどのように到達しますか？

— Glen_b-モニカを復活させる2013

3

「サンプル分位」というものはありません。サンプル変位値には多くの定義があります。どちらを意味するかを指定する必要があります。

— Rob Hyndman、2013年

3

分位数を推定する際のバイアスは、分布のない方法で調査されます。 $p$

http://www.sciencedirect.com/science/article/pii/S016771520000242X

（PDFは同じページにあります）。著者は、ECDFの反転に基づく変位値推定量に焦点を当てています。基礎となる分布に関する仮定は行われません（有限の2次モーメントを除く）。したがって、離散分布も含まれます。

いくつかのハイライト：

バイアスは、基礎となる分布の標準偏差に比例します $\sigma$
バイアスは、中央の分位数が極端な分位数よりも小さくなります。これは、標準偏差すべての分布の中で、バイアスが長さ間隔で振動するという事実に由来します。驚くべきことに、これはサンプルサイズ依存しません。 $\sigma < \infty$ $\frac{\sigma}{\sqrt{p (1-p)}}$ $n$
ためのすべての標準分布のうち、（平均0、標準偏差1）、最悪のバイアスは、確率の原子を有する分布と関連しているで及び確率の原子を at。 $np>3$ $p$ $-\sqrt{(1-p)/p}$ $1-p$ $\sqrt{p/(1-p)}$

— マイケルM
ソース

1

この古い投稿に追加するだけで、ECDFは高いサンプルサイズでのみ公平になります。Nの値が低い場合、バイアスがかかります。N = 1の自明なケースを取り、ECDFはサンプル値以上で1の値を取ります。1の確率を与える基になる分布の値は何ですか？

バイアスは実際にはsqrt（2 * pi）/（2N）* SDまたは1.25 / N * SDを超えているため、Nが5の場合は0.25 SDバイアスになります。

k / Nに基づくECDFの代わりに、（k-0.5）/ Nを試して、偏りのないECDFを取得します。それはあなたに公平なサンプル分位数を与えるかもしれません。また、ECDF（x）= 1-ECDF（-x）が他のすべての累積分布によって享受されることも保証します。

私の非常に謙虚な意見では、定義されて使用されているECDFは非常に誤った名称です。コルモゴロフスミルノフ、リリーフォース、およびその他の標準テストを低Nでバイアスします。

Gilchristの「分位関数による統計モデリング」を確認してください。

— ユーザー2092957
ソース

1

これは興味深い点ですが、技術的にはECDF は公平です。たとえば、ECDF（x）= 1が表示された後、エラーは1つの符号しか持てないことがわかっているため、条件付きで並べ替えのバイアスがあるという事実を参照します。しかし、不偏性の頻繁な特性は、データを見る前の状況を参照しており、参照している条件付きバイアスではありません。

— kjetil b halvorsen

0

固有の真のサンプル変位値定義が存在します（これは通常提示されるものではありません）。参照：http : //dx.doi.org/10.1155/2014/326579

— user153836
ソース

記事は興味深いですが、多くの読者は、議論の要約と、多くの既存の定義が誤って導かれている理由から恩恵を受けるでしょう。

— mdewey 2017年