なぜfベータスコアはそのようにベータを定義するのですか?


10

これはFベータスコアです:

Fβ=(1+β2)precisionrecall(β2precision)+recall

ウィキペディアの記事には、ます。Fβ "measures the effectiveness of retrieval with respect to a user who attaches β times as much importance to recall as precision"

思いつきませんでした。なぜをそのように定義するのですか?私は定義することができます次のように:F ββFβ

Fβ=(1+β)precisionrecall(βprecision)+recall

そして、どのように表示するのβ times as much importanceですか?


2
「なぜベータではなくベータ二乗なのか」に対処する微分計算を含む、以下の新しい回答をチェックしてください。
javadba 2018

回答:


18

まかせあなたが提供する最初の定義における重量となるあなたが設定したときに第二の体重は、二つの定義は等価です、これら二つの定義が唯一の表記の違いを表しているように、スコアの定義。私はそれが最初の方法(例えば、ウィキペディアのページ)と2番目の方法(例えば、ここ)の両方を定義しているのを見てきましβ β = β 2 F βββ~β~=β2Fβ

尺度は、精度と再現率の調和平均、すなわち精度の逆数の平均値の逆数とリコールの逆数を取ることによって得られます。F1

F1=1121precision+121recall=2precisionrecallprecision+recall

代わりに、(1に等しい和である分母の重みを使用するリコールおよび精度のために)、我々はまだ1にまとめる代わり割り当て重みかもしれないが、用リコールに重量がある精度で重量として大倍(リコールおよび精度のために)。これにより、スコアの2番目の定義が得られます。 112 ββ12β 1ββ+1 Fβ1β+1Fβ

Fβ=11β+11precision+ββ+11recall=(1+β)precisionrecallβprecision+recall

ここでも、ここで代わりに使用した場合、最初の定義に到達したはずなので、2つの定義の違いは単なる表記です。 ββ2β


1
なぜ、それらはに再現率ではなく精度項を乗算したのですか?β
アンワルビック2018年

1
「ベータではなくベータが2乗される理由」に対処する微分計算は、以下の新しい回答に含まれています。
javadba 2018

@Anwarvic彼らはに想起を掛けた。を分解してで展開した後、項が残っていますβ(1+β)precisionrecallβprecision
user2740

5

F-βのスコアを定義した理由、正確にあなたが(つまりは、添付したい提供引用ですそれは添付することを意味し何のために特定の定義を与えられた精度としてリコールに多くの重要性など回)正確さよりもリコールのほうが重要です。β2ββ

定式化につながる2つのメトリックの相対的な重要性を定義する特定の方法は、Information Retrieval(Van Rijsbergen、1979)にあります。β2

定義:ユーザーが精度と再現率を重視する相対的な重要性は、となる比です。ここで、は、精度と再現率に基づく有効性の尺度です。P/RE/R=E/PE=E(P,R)

この存在の動機:

これを定量化することについて私が知っている最も簡単な方法は、ユーザーが精度の増加と同等の再現性の損失を交換する意思がある比を指定することです。P/R

このリードことを確認する我々は加重調和平均のための一般式で開始することができる製剤ととに対してそれらの偏導関数計算及び。引用された出典では、(「有効性測定」)を使用していますが、これはあり、説明はとどちらを考慮しても同等です。β2PRPRE1FEF

F=1(αP+1αR)

F/P=α(αP+1αR)2P2

F/R=1α(αP+1αR)2R2

ここで、導関数を互いに等しく設定すると、と比率間の関係に制限が課されます。倍精度を思い出すことを重視したい場合、 1の比率を考慮します。αP/RβR/P

F/P=F/RαP2=1αR2RP=1αα

をこの比率として定義し、を再配置すると、観点から重み付けが行われ。βαβ2

β=1ααβ2=1ααβ2+1=1αα=1β2+1

1α=11β2+1β2β2+1

私達は手に入れました:

F=1(1β2+11P+β2β2+11R)

あなたの質問の形を与えるためにどれを再配置することができます。

したがって、引用された定義を前提として、正確さを想起するために倍の重要度を付加したい場合は、公式を使用する必要があります。使用する場合、この解釈は成り立ちません。だけを使用する場合の同等で直感的ではない解釈は、正確さとして想起するために倍の重要度を付加したいということです。ββ2βββ

提案するようにスコアを定義することもできますが、この場合、説明した解釈がもはや成立しないか、精度と再現率のトレードオフを定量化するために他の定義を示唆していることに注意してください。

脚注:

  1. P/R情報検索で使用されますが、これはタイプミスのようです。Fメジャーの真実(Saski、2007)を参照してください。

参照:

  1. CJ Van Rijsbergen。1979.情報検索(第2版)、pp.133-134
  2. Y.佐々木。2007.「Fメジャーの真実」、教育、チュートリアル資料

1
これは受け入れられる答えになるはずです。
javadba 2018

3

何かをすばやく指摘する。

つまり、ベータ値が高くなるほど、精度が高くなります。

私は実際には逆だと思います-F-βスコアリングは高いほど良いので、分母を小さくしたいとします。したがって、βを小さくすると、精度スコアが高いためにモデルの処罰が少なくなります。βを大きくすると、精度が高いほどF-βスコアが高くなります。

F-βスコアを重み付けして精度を評価する場合、βは0 <β<1である必要があります。ここで、β-> 0は精度のみを評価します(分子は非常に小さくなり、分母の唯一の要素はリコールです。したがって、再現率が増加するとF-βスコアは減少します。

http://scikit-learn.org/stable/modules/generated/sklearn.metrics.fbeta_score.html


0

β^ 2が正確に乗算される理由は、Fスコアの定義方法にすぎません。つまり、ベータ値が高くなるほど、精度が高くなります。リコールを掛け合わせても機能する場合は、ベータ値が大きくなるほどリコールの価値が高くなることを意味します。


0

ベータ値が1より大きい場合は、Precisionと比較して、モデルがモデルのRecallにもっと注意を払うことを望んでいます。一方、1未満の値は、Precisionに重点を置きます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.