回答:
数学的には、b_accはrecall_Pとrecall_Nの算術平均であり、f1はrecall_Pとprecision_Pの調和平均です。
F1とb_accはどちらも分類子評価のメトリックであり、クラスの不均衡を(ある程度)処理します。2つのクラス(NまたはP)のどちらが他のクラスよりも多いかに応じて、各メトリックは他のクラスよりも優れています。
1)N >> Pの場合、f1の方が優れています。
2)P >> Nの場合、b_accの方が優れています。
ラベル切り替えが可能な場合、明らかに、上記の2つの不均衡のいずれの場合でも両方のメトリックを使用できます。そうでない場合は、トレーニングデータの不均衡に応じて、適切なメトリックを選択できます。