2
95パーセンタイルの計算:正規分布、R分位、およびExcelアプローチの比較
次のデータセットで95パーセンタイルを計算しようとしていました。私はそれを行うためのいくつかのオンライン参照に出会いました。 アプローチ1:サンプルデータに基づく 最初のものは得ることが私に語っTOP 95 Percent選択し、次にデータセットのをし、MINまたはAVG結果セットの。次のデータセットに対してこれを行うと、次のことがわかります。 AVG: 29162 MIN: 0 アプローチ2:正規分布を仮定 二つ目は、第95パーセンタイルは約2標準偏差の平均を上回っている(私は理解している)と私が実行したことを言います: AVG(Column) + STDEV(Column)*1.65: 67128.542697973 アプローチ3:R分位点 以前Rは95パーセンタイルを取得していました。 > quantile(data$V1, 0.95) 79515.2 アプローチ4:Excelのアプローチ 最後に、私はこれに出会いました。それはExcelがそれをどのように行うかを説明しています。メソッドの概要は次のとおりです。 N順序付けられた値のセットと{v[1], v[2], ...}、pthパーセンタイルを計算するための要件が与えられたら、次の手順を実行します。 計算する l = p(N-1) + 1 l整数と小数のコンポーネントに分割l = k + d 必要な値を次のように計算します V = v[k] + d(v[k+1] - v[k]) この方法は私に与えます 79515.2 Rの値は正しいと信じていますが、値は一致しません(ecdfプロットからも観察しました)。私の目標は、特定のデータセットから95番目のパーセンタイルを(AVGおよびSTDEV関数のみを使用して)手動で計算することであり、ここで何が起こっているのか実際にはわかりません。誰かが私が間違っている場所を教えてもらえますか? 93150 93116 …