中央値の信頼区間


8

一連の値があり、その中央値Mを計算します。この推定の誤差をどのように計算できるのか疑問に思いました。バツ=1N

ネット上では、として計算できることがわかりましたここで、は標準偏差です。しかし、それについての言及は見つかりませんでした。なぜか分かりません。誰かに説明してもらえますか?1.2533σNσ

ブートストラップを使用してエラーの見積もりを取得できると考えていましたが、分析が大幅に遅くなるため、回避したいと思います。

また、この方法で中央値の誤差を計算することを考えていました

δM=ΣバツM2N1

それは意味がありますか?


1
データが正常に配布されていることを確実に知っていますか?
ガン-モニカの復活

彼らは対数正規です
シャマライア

4
ブートストラップは機能するはずで、長い時間はかかりませんでした。完全な十分なデータセットがあり、ブートストラップを実行する必要がない場合は、変数の中央値を実際の中央値の適切な推定値としてください。または、かなり小さなデータセットがあり、ブートストラップを使用して、余計な時間をかけずにマージンエラーの中央値を推定できます。
YCR


2
中央値の分布に関する広範な情報は、stats.stackexchange.com / a / 86804/919の私の投稿に記載されています。ノンパラメトリックおよび正規近似の信頼区間の両方に必要な理論を開発します。
whuber

回答:


12

中央値の誤差を直接処理するには、次数統計を使用する中央値の正確なノンパラメトリック信頼区間を使用できます。異なるもの、つまりばらつきの尺度が必要な場合は、ジニの平均差を考慮してください。中央値の信頼区間のコードはこちらです。


S=cメートルedjメートルedj|バツバツj|

1
データ分布が非対称である場合、中央値には非対称エラーがなければなりません。
フランクハレル2016

11

他の回答で指摘されているように、順序統計を使用する中央値にはノンパラメトリックCIがあります。そのCIは、ネットで見つけたものよりも多くの点で優れています。

1.2533σNθθ

θθLN014[fθ]2

f[fθ]2θσ2f

[fθ]2=12πσ2

そして、漸近分散は

2π4σ2

N1.2533σN


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.