中央値の標準誤差


14

非正規分布の小さなサンプルの場合に中央値の標準誤差を測定したい場合、次の式は正しいですか(Pythonを使用しています)?

 sigma=np.std(data)
 n=len(data)
 sigma_median=1.253*sigma/np.sqrt(n)

回答:


12

@maryのコメントのいくつかに基づいて、以下が適切であると思います。サンプルが小さいため、彼女は中央値を選択しているようです。

中央値を選択していた場合、それは正当な理由ではない小さなサンプルであるためです。中央値は重要な値であるため、中央値を選択します。それは平均とは異なる何かを言います。また、外れ値やスキューなどの特定の問題に対して堅牢であるため、一部の統計計算用に選択することもできます。ただし、サンプルサイズが小さいことは、堅牢な問題の1つではありません。たとえば、サンプルサイズが小さくなると、実際には平均よりもスキューに敏感になります。


ジョンありがとう!実際、私はあなたが書いたばかりの理由から、平均値の代わりに中央値を使用することにしました。異なるサンプルがありますが、それらはすべて非ガウス分布です。50ポイント以上のサンプル、10ポイント未満のサンプルがありますが、それらすべてについて、あなたのコメントは有効だと思いますよね?
メアリー

ポイントが非常に少ないので、基礎となる分布について何が言えるかわかりません。10未満のサンプルを50のサンプルと比較し、基礎となる分布が対称ではない場合、1つが存在しなくても中央値は効果を示します。平均はしません。
ジョン

将来的には、質問をより具体化し、本当に知っておくべきことについてもっと質問してください。なぜ今までやったことをしたのか、そしてあなたが持っているデータを説明してください。より良い答えが得られます。
ジョン

1
サンプルサイズが小さいことは、堅牢な問題の1つではありません」は、単独で+1する価値があります。残りはボーナスです
Glen_b -Reinstateモニカ

実際、フーバーは本の中で、堅牢性の概念は一つもないと指摘しています。外れ値に対してロバスト性があります(これが中央値がロバストな理由です)。ただし、別の見方は、測定誤差に対する堅牢性であり、これらの測定誤差を平均するため、平均が堅牢であるのはそのためです。ただし、中央値は、分布の中央にテールと同じくらい悪い影響を与える可能性があるため、測定誤差の変動の影響を非常に受けやすくなります。
StasK

12

SokalとRohlfは、本Biometry(139ページ)でこの式を示しています。「適用性に関するコメント」の下に、彼らは次のように書いています したがって、私はあなたの質問への答えがノーであることを恐れています。こちらもご覧ください

非正規分布の小さなサンプルの中央値の標準誤差と信頼区間を取得する1つの方法は、ブートストラップです。 この投稿では、ブートストラップ用のPythonパッケージへのリンクを提供します。

警告

@whuberは、ブートストラップの正当性が漸近的であるため、小さなサンプルの中央値をブートストラップすることはあまり有益ではないと指摘しました(以下のコメントを参照)。


ご回答有難うございます!ブートストラップが代替手段であることは知っていますが、中央値の誤差を別の方法で測定する方法があるかどうかだけを推測していました。MEANの標準誤差(同じ小さな非ガウスのサンプル)に対しても答えはノーですか?
メアリー

@mary平均の標準誤差について、SokalとRohlは、「[...]有限分散の母集団」に適用できると書いています。そのため、平均の標準誤差の答えは「はい」であるように見えます。あなたはそれを計算することができます。補足:ただし、定義された分散または平均を持たない分布(コーシー分布など)があり、そのような場合、SEMは計算できません。
COOLSerdash

5
tt

@whuberコメントありがとうございます。知っておくといいです。回答から小さなサンプルの中央値をブートストラップするアドバイスを削除しました。
COOLSerdash

1
私はそれが悪いアドバイスであることを提案しようとしていませんでした:私はその(避けられない)制限を指摘したかっただけです。小さなサンプルから多くを学ぶことは困難です。しかし、小さなサンプルをブートストラップすることは、それをサポートする理論的な正当化がないため、二重に困難です(すべての正当化は漸近的です)。
whuber

12

As.Var.[m^]=14f(m)2n
mf(m)

m^

  1. 分散の漸近式が小さなサンプルに対して機能すること。
  2. 推定中央値が真の中央値に十分近いこと。
  3. カーネル密度推定器が正確な値を与えること。

サンプルサイズが小さいほど、疑わしくなります。


3
おそらく、魔法の数があることを追加する価値がありますπ21.253314
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.