TL; DR
精度は不適切なスコアリングルールです。使用しないでください。
少し長いバージョン
実際、精度はスコアリングルールではありません。したがって、それが(厳密に)適切かどうかを尋ねることは、カテゴリエラーです。私たちが言えることは、追加の仮定の下では、精度は不適切で、不連続で、誤解を招くスコアリングルールと一致しているということです。(使用しないでください。)
あなたの混乱
あなたの混乱は、あなたが引用した論文による誤分類の損失も採点規則ではないという事実から生じています。
詳細:スコアリングルールと分類評価
用語を修正しましょう。我々は、バイナリ転帰に興味を持っている、我々は確率的予測有するQ = P(Y = 1 )∈ (0 、1 )。我々は知っているP (Y = 1 )= η > 0.5が、私たちのモデルQy∈{0,1}qˆ=Pˆ(Y=1)∈(0,1)P(Y=1)=η>0.5qˆまたはそれを知らない場合があります。
スコアリングルールは、確率的予測かかるマッピングであり、Q及び転帰Yをqˆy、損失
s:(qˆ,y)↦s(qˆ,y).
あり、適切それはによって期待に最適化されている場合、Q = η。(通常は「最小化」を意味しますが、いくつかの著者は、フリップ徴候やスコアリング・ルールを最大化しようとする「最適化」。) sがある厳密に正しいことを期待して最適化されている場合のみで、Q = ηsqˆ=ηsqˆ=η。
私たちは、一般的に評価する多くの予言の上のq Iと結果を対応するY I、平均はこの期待を推定します。sqˆiyi
さて、精度とは何ですか?精度は、確率的予測を引数として取りません。これは、分類かかりY ∈ { 0 、1 }yˆ∈{0,1}と結果を:
a:(yˆ,y)↦a(yˆ,y)={1,0,yˆ=yyˆ≠y.
したがって、 精度はスコアリングルールではありません。分類評価です。(これは私が発明したばかりの用語です。文献で探してはいけません。)
qˆyˆθ
yˆ(qˆ,θ):={1,0,qˆ≥θqˆ<θ.
θ=0.5qˆiyi、次に我々はあたりブジャらとして誤分類損失に正確に到達します。したがって、誤分類損失もスコアリングルールではなく、分類評価です。
qˆqˆyˆ=yˆ(qˆ,θ)qˆ
qˆ=ηθ=0.5qˆ∈(0,1)
yˆqˆ。
qˆ≥θθ=0.5qˆ=0.99qˆ≥θqˆη
θ=0.2y=1y=0qˆqˆ=0.25qˆ≥θ
したがって、正確性または誤分類の損失は誤解を招く可能性があります。
さらに、結果がiidではないより複雑な状況では、追加の仮定の下では精度と誤分類の損失は不適切です。Frank Harrellのブログ投稿で、分類精度およびその他の不連続な不適切な精度スコアリングルールによって引き起こされる損傷は、精度または誤分類損失を使用するとモデルが誤って指定されてしまうため、彼の本の1つの例を引用しています、正しい条件付き予測によって最適化されてしています確率。
θ
詳細については、分類モデルを評価するために精度が最良の尺度ではない理由を参照してください。。
一番下の行
精度を使用しないでください。誤分類の損失もありません。
短編:「厳格」対「厳格」
「厳密な」適切なスコアリングルールについて、または「厳密に」適切なスコアリングルールについて話す必要がありますか。「厳密」は「スコアリング規則」ではなく「適切」を変更します。(「適切なスコアリングルール」と「厳密に適切なスコアリングルール」がありますが、「厳密なスコアリングルール」はありません。)「strictly」は形容詞ではなく副詞であり、「strictly」を使用する必要があります。文学でより一般的であるように、例えば、ティルマン・グナイティングによる論文。