分位の定義


10

N個のサンプル値がある場合、「サンプル値のp番目の分位数」は何を意味しますか?

回答:


9

理論的には( 0<p<1)それは分数のポイントを意味します p累積分布をアップします。実際には、特に統計計算で使用されるさまざまな定義があります。たとえば、Rには9つの異なる定義があります。最初の3つは離散解釈用で、残りはさまざまな連続補間用です。

次に例を示します。サンプルが{400、1、1000、40}で、0.6分位(60パーセンタイル)を探している場合、さまざまな計算方法で次のようになります。

> for (t in 1:9) { x[t] <- quantile(c(400, 1, 1000, 40), probs=0.6, type = t ) }
> x
60%                                 
400 400  40 184 364 400 328 376 373 

私の個人的な見解では、正しい数字は400が正しいということです。

Pr(X<400)=0.5<0.6 and Pr(X>400)=0.25<10.6.
これは、サンプルを母集団として扱うことから生じます。経験的CDFが引き出された場合、それは一連のステップになります。母集団に対するより良い、またはより有用な近似である可能性が高いため、経験的CDFが連続的であり、内挿法が結果に影響を与える可能性があるため、内挿には反対の引数があります。

4
en.wikipedia.org/wiki/…のWikipediaページには、さまざまな定義の優れた表があります。
Rob Hyndman、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.