Gメジャー(またはFowlkes–Mallowsインデックス)が(教師なし)クラスタータスクに一般的に使用されるのに対し、Fメジャーは通常(教師付き)分類タスクに使用されるのはなぜですか?
Fメジャーは、精度と再現率の調和平均です。
Gメジャー(またはFowlkes–Mallowsインデックス)は、精度と再現率の幾何平均です。
以下は、異なる平均のプロットです。
私が尋ねる理由は、BLEUとROUGEを測定したNLGタスクで使用する平均を決定する必要があるためです(ここでBLEUは精度とROUGEはリコールに相当します)。これらのスコアの平均をどのように計算すればよいですか?
たぶん、それが定義がどうなるかだけです!
—
Aditya 2018
@Aditya、あなたは正しい、それは定義についてのひどく定式化された質問でした。私はそれをより具体的なものに再編成して編集しました。
—
Bruno Lubascher