中央値の95％CIがはずなのはなぜですか？

さまざまなソース（たとえば、こちらを参照）では、中央値（特に箱ひげ図にノッチを描く目的）の信頼区間について次の式が与えられています。

95 % C I_{m e d i a n} = M e d i a n \pm \frac{1.57 \times I Q R}{\sqrt{N}}

$95\%\ CI_{\rm median} = {\rm Median} \pm \frac{1.57\times IQR}{\sqrt{N}}$

魔法の定数夢中です。どうやって取得したのかわかりません。さまざまな近似（たとえば、分布がガウスでが大きいと仮定）では手掛かりが得られません—定数の値は異なります。 $1.57$ $N$

— イリヤ・V・シュロフ
ソース

参照してくださいstats.stackexchange.com/questions/228719/...

— Glen_b -Reinstateモニカ

簡単だ。ノッチ付きの箱ひげ図が導入された元の論文を確認すると（Robert McGill、John W.TukeyおよびWayne A.Larsen。Variations of Box Plots、The American Statistician、Vol。32、No。 1978）、pp。12-16 ;幸い、それはJSTORにあります）、セクション7でこの式が次のように正当化されていることがわかりました。

各中央値について95％の信頼区間を示すノッチが必要な場合は、C = 1.96を使用します。[ここでCは私たちに関連する異なる定数ですが、正確な関係は後で明らかになるように重要ではありません— IS]ただし、95％レベルでの有意差を示す「ギャップゲージ」の形式が望まれていたため、これは行われませんでした。C = 1.96は、2つのグループの標準偏差が大きく異なる場合にのみ適切であることを示すことができます。それらがほぼ等しい場合、C = 1.386が適切な値となり、1.96は非常に厳しいテストになります（99％をはるかに超えます）。 これらの制限値C = 1.7は、経験的に望ましい値として選択されています。 したがって、使用されたノッチは次のように計算されました $M \pm 1.7(1.25R/1.35 \sqrt{N})$ 。

強調は私のものです。マジックナンバーであるであることに注意してください。 $1.7\times 1.25/1.35=1.57$

つまり、簡単な答えは、これはCIの中央値の一般的な式ではなく、視覚化のための特定のツールであり、定数は特定の目標を達成するために経験的に選択されたものです。

魔法はありません。

ごめんなさい。

— イリヤ・V・シュロフ
ソース