使用する「意味」とは?


197

したがって、算術平均(AM)、幾何平均(GM)、調和平均(HM)があります。それらの数学的定式化は、関連するステレオタイプの例とともによく知られています(例えば、調和平均と「速度」関連問題への応用)。

ただし、常に興味をそそられる質問は、「どのコンテキストが特定のコンテキストで使用するのに最も適切であるかをどのように判断するのですか?」です。適用可能性を理解するために、少なくともある程度の経験則がなければなりませんが私が出くわした最も一般的な答えは、「それは依存します」(しかし何に依存しますか?)です。

これはかなり些細な質問のように思えるかもしれませんが、高校のテキストでさえこれを説明できませんでした-彼らは数学的な定義のみを提供します!

数学的な説明よりも英語の説明の方が好きです。簡単なテストは「お母さん/子供が理解できるでしょうか?」


20
これはおそらく過度に単純化されますが、私は常に範囲と観測値を使用しています。範囲が同じ= AM(スコア0-100から0-100を比較)、範囲は異なるが観測値が同じ場合= GM(スコア1-5から0-10を比較)、範囲は同じで観測値は異なる= HM(異なるobsでの車の速度、2つの梯子の高さ、他の「レート」)。
ブランドンバーテルセン

>「依存する」(しかし何に依存する?)データ処理アルゴリズムに依存する。
マクソン

どちらを使用するかを選択するだけではありません。また、対象となる母集団またはプロセスを記述する要約統計量のセットの選択です。おそらく非常に複雑なものを記述するために必要なのは単一の数字だけだと考えるべきではありません。
JimB

回答:


160

この答えは、あなたが探していたものよりもわずかに数学的な傾向があるかもしれません。

認識すべき重要なことは、これらの手段のすべてが、単に変装した算術平均であることです。

3つの一般的な手段(算術、幾何学、または調和)のどれが「正しい」平均であるかを特定する際の重要な特性は、当面の問題で「付加的な構造」を見つけることです。

言い換えるといくつかの抽象的な量が与えられていると仮定します。これを「測定」と呼び、一貫性のためにこの用語を多少乱用します。これらの3つの各手段は、(1)各を一部の変換し、(2)算術平均を取得し、(3)元の測定スケールに戻すことで取得できます。x1,x2,,xnxiyi

算術平均:明らかに、「同一性」変換を使用します。したがって、ステップ(1)および(3)は簡単で(何も行われない)、です。yi=xix¯AM=y¯

幾何平均:ここでは、加法的構造は元の観測値の対数上にあります。したがって、を取得し、ステップ(3)でGMを取得するには、逆関数、つまり。yi=logxilogx¯GM=exp(y¯)

調和平均:ここでは、加法的構造は観測の逆数にあります。したがって、、ここから。yi=1/xix¯HM=1/y¯

物理的な問題では、これらはしばしば次のプロセスを通じて発生します。測定値および他のいくつかの量、たとえばに関連して固定された量があります。キープ:今、私たちは以下のゲームプレーと定数といくつか探してみてください我々は交換した場合、そのようなことを、それぞれ私たちの個々の観測のによって、そして「合計」の関係はまだされて保存さをwx1,,xnz1,,znwz1++znx¯xix¯

距離-速度-時間の例は人気があるように見えるので、それを使用しましょう。

一定の距離、さまざまな時間

固定距離検討します。ここで、この距離を速度で回移動し、時間をとるとします。ゲームをプレイします。合計時間が一定になるように、個々の速度を固定速度に置き換えたいとします。 ため、あることに注意してください 。ゲームで各をに置き換えるときに、この合計関係(合計時間と合計移動距離)を保存する必要があります。したがって、 dnv1,,vnt1,,tnv¯

dviti=0,
i(dviti)=0viv¯
ndv¯iti=0,
そして、各、 ti=d/vi
v¯=n1v1++1vn=v¯HM.

ここでの「付加構造」は個々の時間に関するものであり、測定値はそれらに反比例するため、調和平均が適用されることに注意してください。

さまざまな距離、一定の時間

それでは、状況を変えましょう。以下のためにあるとしインスタンス、我々は一定の時間旅行速度がで距離を超える。ここで、合計距離を保存する必要があります。我々は持っている そして場合、システム全体が保存されている。もう一度ゲームをプレイして、 となるを探し が、、を取得し ntv1,,vnd1,,dn

divit=0,
i(divit)=0v¯
i(div¯t)=0,
di=vit
v¯=1nivi=v¯AM.

ここで、維持しようとしている付加構造は、測定値に比例するため、算術平均が適用されます。

等体積キューブ

与えられた体積で次元のボックスを構築し、測定値がボックスの辺の長さであるとします。次に、 で、同じ体積の次元(ハイパー)キューブ を構築したいとします。つまり、個々の辺の長さを共通の辺の長さに置き換えます。次に、 nV

V=x1x2xn,
nxix¯
V=x¯x¯x¯=x¯n.

これは、を取る必要があることを簡単に示しています。x¯=(xixn)1/n=x¯GM

加法構造は対数、つまり、あり、左側の量を節約しようとしていることに注意してください。logV=ilogxi

古いから新しい手段

演習として、最初の例で距離と時間の両方を変化させた場合の「自然」の意味を考えてください。つまり、距離、速度、および時間ます。総距離と移動時間を節約し、これを達成するために一定のを見つけます。divitiv¯

演習:この状況で「自然」とはどういう意味ですか?


25
+1これは素晴らしい答えです。ただし、重要な点で不完全だと思います。多くの場合、使用する正しい手段は、データの数学的な構造ではなく、答えようとしている質問によって決まります。この良い例は、環境リスク評価で発生します。規制当局は、汚染物質への人口の経時的な総暴露を推定したいと考えています。通常、環境濃度データは乗法構造を持っています、これに適切に重み付けされた算術平均が必要です。幾何平均は間違った推定量または推定量になります。
whuber

7
@whuber:(+1)これは素晴らしいコメントです。答えを構築する道のりで、明らかに統計的ではない分岐をとったので、これについて言及してくれてうれしいです。これは完全な答えに値するトピックです(ヒント)。
枢機

9
@whuber:統計分析は、ドメインにとって意味のある何かを推定したいが、ほとんどの場合、ドメインの専門家(または、おそらくあなたの例では、専門家でなくても)の監視の対象になることがあるという事実を(おそらく意図せずに)持ち出します統計的にまったく不自然です。私が過去にそこに出くわした問題は、彼らが時々統計的推定が実行される方法を指示したいということです!:)
枢機

1
@whuber:その視点も答えに加えて、詳しく説明していただければ幸いです。正直なところ、あなたの説明はStats.SEで見た中で最高の1つです!
PhD

3
@whuberからのいつものすばらしいコメント。時々(おそらく頻繁に!)使用する正しい意味はnoneです; むしろ、質問はしばしば「どのような中心傾向の尺度を使用すべきか」に広げる必要があります。
ピーター・フロム

43

@Brandonの優れたコメントを展開します(回答を促進する必要があると思います)。

乗法的差異に関心がある場合は、幾何平均を使用する必要があります。Brandonは、範囲が異なる場合は幾何平均を使用する必要があると指摘しています。これは通常正しいです。その理由は、範囲を均等化するためです。たとえば、大学の志願者がSATスコア(0〜800)、HSの成績平均点(0〜4)、および課外活動(1〜10)で評価されているとします。大学がこれらを平均化して範囲を均等にしたい場合(つまり、範囲と比較して各品質の重量が増加する場合)、幾何平均が道になります。

しかし、異なる範囲のスケールがある場合、これは必ずしも当てはまりません。異なる国(貧しい国と豊かな国を含む)の収入を比較する場合、おそらく幾何平均ではなく、算術平均(または、より可能性の高い中央値またはトリム平均)が必要です。

私が高調波平均で見た唯一の用途は、レートを比較することです。例として:あなたは40 MPHでボストンにニューヨークから車、および60 MPHで返す場合は、あなたの全体の平均ではありません 50 MPHの算術平均が、調和平均。

AM = HM =(40+60)/2=502/(1/40+1/60)=48

これがこの簡単な例に適していることを確認するには、NYCからボストンまで120マイルだと想像してください。その後、そこのドライブは3時間かかり、ドライブのホームは2時間かかり、合計は5時間、距離は240マイルです。240/5=48


3
SAT / GPA /課外の例で、加重またはスケーリングされた算術平均ではなく幾何平均を使用するのはなぜですか?SATまたはGPAがゼロの場合、他の2つの値が無関係になることを意味するのはなぜですか(幾何平均が示すように)?また、(たとえば)課外活動が、その理論的範囲よりもはるかに狭い帯域に集中する傾向がある場合はどうでしょうか。生の値の幾何平均よりも、パーセンタイル(または他の調整値)の算術平均を取る方が理にかなっているようです。
ruakh

1
@ruakh興味深い。この場合、SATとGPAを実際に0にすることはできません(SAT = 0はほとんど不可能であり、0のGPAは卒業しません)ので、0の問題は本当に重要ではありません。パーセンタイルの算術平均は、その結論の幾何平均に近いと思います(実際の数値ではありませんが)。
ピーターフローム

31

私はそれを3〜4の経験則に要約し、ピタゴラス平均のいくつかの例を提供しようとします。

3つの平均の関係は、多少の変動がある非負データの場合、HM <GM <AMです。サンプルデータに変化がまったくない場合にのみ、それらは等しくなります。

レベルのデータには、AMを使用します。価格が良い例です。比率については、GMを使用します。投資収益率、ブルームバーグビリーインデックス(さまざまな国のイケアのビリー本棚の価格と米国価格との比較)、および国連の人間開発指数などの相対価格はすべて例です。HMは、レートを扱うときに適切です。以下は、David Gilesの好意による非自動車の例です。

たとえば、「週あたりの労働時間」(率)に関するデータを検討します。4人の人(サンプルの観察)がいて、それぞれが合計2,000時間働いているとします。ただし、次のように、週ごとに異なる時間数で動作します。

Person      Total Hours       Hours per Week          Weeks Taken
1                  2,000                  40                   50
2                  2,000                  45                   44.4444
3                  2,000                  35                   57.142857
4                  2,000                  50                   40

Total:           8,000                                       191.587297

3列目の値の算術平均は、AM =週42.5時間です。ただし、この値が意味するものに注意してください。サンプルメンバーが働いた週の総数(8,000)をこの平均値で割ると、4人全員が働いた週の総数として188.2353の値が得られます。

上の表の最後の列を見てください。実際、サンプルメンバーが働いた週の総数の正しい値は191.5873週間です。表の3列目の1時間あたりの時間の値の調和平均を計算すると、HM = 41.75642時間(<AM)になり、この数を8,000時間に割ると、合計数191.5873の正しい結果が得られます。数週間働きました。調和平均がサンプル平均に適切な測定値を提供する場合を次に示します。

また、デビッドは、インフレを測定するために使用される価格指標に登場する3つの手段の加重バージョンについても説明します。

ハイジャックは別として:

これらのROTは完全ではありません。たとえば、何かがレートなのか比率なのかを把握するのは難しいと感じることがよくあります。投資のリターンは、通常、平均を計算するときに比率として扱われますが、通常は「単位時間あたりx%」で表されるため、レートでもあります。「データが単位時間あたりのレベルであるときにHMを使用する」のは、より良い発見的方法でしょうか?

北欧諸国のビッグマックインデックスを要約する場合、GMを使用しますか?


3
数年遅れましたが、「北欧諸国のBig Macインデックスを要約したい場合、GMを使用しますか?」という質問に対する答えを見つけましたか??
StatsScared

2
@StatsScaredいや、でもそれはいい質問だね!
Dimitriy V. Masterov

7

あなたの質問への可能な答え(「どのコンテキストが特定の文脈で使用するのに最も適切であるかをどのように決定しますか?」)は、イタリアの数学者オスカー・チシーニによって与えられる平均の定義です。

ここに、より詳細な説明といくつかの例(平均移動速度など)を含む論文があります。


6
リンクが機能しなくなった場合、および/または読者がリンクをクリックしてアイデアをさらに追求したいかどうかを知るのに役立つように、ここにChisiniの定義に関する数行を追加できれば理想的です。
グング

2
確かに、論文へのリンクは死んでいます。Wolframリンクは、特定のコンテキストでどちらの手段を使用するかを決定するのにChisiniの定義がどのように役立つかについての洞察を提供しません。私には、使用の処方箋とは対照的に、数学的一般化だけであるように思われます。
ライアンシモンズ

1
DOIを使用すると、論文がtandfonline.comに移動したことがわかります。引用:R Graziani、P Veronese(2009)。平均を計算する方法は?Chisiniのアプローチとその応用。アメリカ統計学者63(1)、pp。33-36。tandfonline.com/doi/abs/10.1198/tast.2009.0006
akraf

0

質問に答える簡単な方法は次のとおりだと思います。

  1. 数学的構造がxy = k(変数間の逆関係)であり、平均を探している場合、調和平均を使用する必要があります-これは加重算術平均に相当します-を考慮する

調和平均= 2ab /(a + b)= a(b / a + b)+ b(a /(a + b)

例:投資する金額(A)は固定されているが、1株あたりの価格(P)と株式数(N)は異なるため(A = PN)、ドルコスト平均はこのカテゴリに分類されます。実際、算術平均を2つの数値の中央に均等に配置された数値と考えると、調和平均も2つの数値の中央に均等に配置された数値になります(ただし、これは素晴らしいことです)。等しい。つまり、(x-a)/ a =(b -x)/ b、ここでxは調和平均です。

  1. 数学構造が直接変動y = kxである場合、算術平均を使用します。これは、この場合に調和平均が減少するものです。

1
調和平均式でブラケットの一致を確認する必要があると思います-数学の組版にLatexマークアップを使用して、ドル記号で囲むことにより、たとえば$x$生成できることに注意してください。分数については、を生成することに注意してください。詳細については、編集ヘルプをご覧ください。x\frac{a}{b}ab
シルバーフィッシュ

いくつかの異なるモデルの確率の平均をまとめたいとしましょう。その場合、幾何平均または調和平均を使用することは理にかなっていますか?
thecity2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.