調和平均の代わりに加重算術平均を使用しないのはなぜですか?


12

精度と再現率の組み合わせにおける加重算術平均とは対照的に、調和平均を使用することの固有の値は何ですか(たとえば、Fメジャーを計算するため)。加重算術平均が調和平均の役割を果たす可能性があると考えていますか、それとも何か不足していますか?


9
調和平均加重算術平均です。各の重みは比例します。 1 / x 2 ixi1/xi2
whuber

この方法で精度と再現率がどのように組み合わされるかについて、もう少し詳しく説明できますか?
AdamO

6
@whuberコメントが真面目なのか、それとも口癖なのかわかりません。重みは通常、サンプルではなく、サンプルインデックスの関数であると見なされます。それ以外の場合平均は加重算術平均です
Luis Mendo

2
@Luis真実は間にあります。多くの場合、サンプルインデックスは無意味です。重みはオブジェクトの関数ですが、これらの関数は通常、平均される値に依存しません。例は、時間に関連付けられた重み(EWMA)、場所(空間相関の測定など)、ランク(Shapiro-Wilkテストの場合)、および確率のサンプリングです。しかし、すべての手段が重み付けされたAMではありません。たとえば、GMはそうではありません。フィリッパは「本質的な値」について尋ねているので、調和平均と加重平均の間の数学的関係を指摘することは密接に関係しているように見えました。
whuber

回答:


18

一般に、整数ではなくレートを平均化しようとする場合は、調和平均が推奨されます。F1メジャーの場合、調和平均は非常に小さな精度または再現率にペナルティを課しますが、重み付けされていない算術平均はペナルティを課しません。100%と0%の平均を想像してください。算術平均は50%、調和平均は0%です。調和平均では、精度と再現率の両方が高い必要があります。

さらに、精度と再現率が近い場合、調和平均は算術平均に近くなります。例:95%と90%の調和平均は、92.5%の算術平均と比較して92.4%です。

これが望ましいプロパティであるかどうかは、おそらくユースケースに依存しますが、通常は良いと考えられています。

最後に、@ whuberがコメントで述べたように、調和平均は実際には加重算術平均であることに注意してください。


2
「1は、平均レートしようとしているとき、高調波手段が好適である」 おそらく、あなたが旅行する場合時からキロを120キロ/ hで10時キロバック60の全体の平均速度を得るためにキロ/ hで、80キロ/ hにないあなたならば、しかし、120 km / hで10分、60 km / h で10分移動すると、平均全体速度は90 km / hになります。しかし、それが分数に当てはまる理由はわかりません1012010608010120106090
ヘンリー

確かに、最初の段落は調和平均に関するより一般的な記述です。しかし、あなたの言う通り、精度と再現率は分数であり、率ではありません。解釈可能な合計がある算術平均が望ましいという考えがあると思います(この場合は適用されません)が、確かに精度の算術平均を取得し、有用な結果を呼び出して出力することができます。
イランマン2018

優秀な!調和平均化ルールを使用するための「正当化」をもっと探しています。しかし、私は...正当化について考えるかどうかはわかりません
オルガ

10

調和平均は、算術平均に期待値や分散がない場合に、算術平均の便利な代用になることがあります。確かに、E [ 1 / X ]が存在するのに、が存在しないか無限である場合があります。密度と、例えば、パレート分布F X = α X α 0E[X]E[1/X]ない有限の期待を持っていない場合α1算術平均が、一方で無限の期待を持っていることを意味する、E[1/X]= X 0 αX α 0

f(x)=αx0αxα+1Ixx0
α1これは、調和平均が有限の期待値を持つことを意味します。
E[1/バツ]=バツ0αバツ0αバツα+2dバツ=αバツ0αα+1バツ0α+1=αα+1バツ0

逆に、調和平均は、例えばように、ベータ全く期待を持たないために分布がある分布α 1。そして、それのためにそれは変動がありません。Beαβα1

ベイジアン事後同一性E [ φ θ に基づいて、積分、特に定数を正規化するモンテカルロ近似とのリンクもあります。

E[φθπθLθ|バツ|バツ]=1メートルバツ
φπL|バツメートル

2
レートを平均化するときにこれらの特性が望ましいのはなぜですか?
猫のセイウチ

最適性の結果はわかりませんが、有限の期待値を持つ推定量を持つことは、推定量を持たない推定値よりも好ましいようです!
西安
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.