切り捨てまたはトリミングされた平均の計算方法は?


8

切り捨てまたはトリミングされた平均を計算するにはどうすればよいですか?10%切り捨てたとしましょうか?

エントリが10個程度ある場合はどうすればよいか想像できますが、多くのエントリに対してはどうすればよいですか。


1
切り捨ての代わりにトリミングされたタグを付ける必要がありますか?

回答:


19

トリミングされた平均には、両端からパーセントの観測値をトリミングすることが含まれます。P

例:10%トリム平均の計算を求められた場合、です。P=10

一連の観測を前提として、Xi

  1. 最初に =観測数を見つけます。n
  2. それらを「順序統計」として最小から最大に並べ替えます。 Xi
  3. 小文字の =トリミングされた比率を見つけます。p=P/100
  4. 計算します。np

場合整数使用でK = N P トリムkの両端の観察。 npk=npk

=残りの観測値= n 2 kRn2k

トリミングされた平均= (1/R)(Xk+1+Xk+2++Xnk).

:の10%トリミングされた平均を見つける

2、4、6、7、11、21、81、90、105、121

ここで、は整数なので、k = 1であるため、両端で1つの観測値を正確にトリミングします。したがって、2と121を削除します。R = n 2 k = 10 2 = 8の観測値が残ります。n=10,p=0.10,k=np=1k=1R=n2k=102=8

10%トリミング平均=(1/8)*(4 + 6 + 7 + 11 + 21 + 81 + 90 + 105)= 40.625

場合は小数部の存在があり、トリム平均は、もう少し複雑です。上記の例で、15%のトリム平均が必要な場合、 P = 15 p = 0.15 n = 10 k = n p = 1.5です。これには整数部1があり、小数部0.5があります。 R = n 2 k = 10 2 1.5 = 10 3 = 7です。したがって、R = 7npP=15,p=0.15,n=10,k=np=1.5R=n2k=1021.5=103=7R=7 観察は保持されます。

(4/2+6+7+11+21+81+90+105/2)/7=38.64

出典: Pパーセントトリム平均のクラスノート


@Mehper最後の例では、どの3つの観測を削除しますか?明らかに2と121ですが、他に何がありますか?公平なままにし、削除しなければならないと思われるハーフ 4及び半分 105のトリミング(4/2 + 6 + 7 + 11 + 21 + 81 + 90 + 2分の105)/ 7 = 34.64の平均
whuber

@Mehper:参考までに、$記号の間にTeX式を記述することで、数式をフォーマットできます。例$X_i$
nico

@whuber:コメントをありがとう、あなたのコメントを回答に追加しました。@nico:TeXのフォーマットについて教えてくれてありがとう。TeX形式で回答を更新してみましたが、うまく管理できませんでした。投稿でTeXスタイルを使用する方法を説明するリンクを教えていただけませんか。TeXの経験はありません。
Mehper C. Palavuzlar 2010年

1
@Mehper:グーグル「TeXマニュアル」を選択してください。便利で読みやすい表が含まれているため、「穏やかな紹介」が好きです。tex.ac.uk
archive

1
@Mepher:はい、どうぞ。mathjax.org/help/user(数式を右クリックすると、そのページにリンクするコンテキストメニューが表示されることに注意してください)。TeXの代わりにMathMLを使用することもできます(非常に勇気がある場合:P)。
nico

5

上記の回答に加えて、多くのエントリ(nなど)がある場合、最初のソートには時間がかかりますO(n log n)。ただし、線形時間のソリューションがあります。

  1. P-分位Lと(1-P)-分位Uを計算します。これには、予想される線形時間で実行される単純な(クイックソートのような)アルゴリズムがあります。最悪の場合線形時間で実行されるより複雑なアルゴリズムもあります。どちらも、たとえば、Cormen、Leiserson、Rivest、Stein:Introduction to Algortithmsにあります。

  2. すべての値をスキャンし、LとUの間の値を追加します。これには明らかに線形時間がかかります。

  3. タイがあり、計算された変位値が値の間に数回存在する場合、追加した値が多すぎるか少なすぎる可能性があり、これを適切に修正する必要がある場合があります。手順2で追加した数値の数と、LとUを何回目にしたかがわかっているため、これは一定の時間で実行できます。

  4. 合計を加数の数で割ります。

上記のレシピは、nが本当に大きく、それらすべてをソートすると、おそらく数百万のパフォーマンスヒットになる場合にのみ価値があることに注意してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.