使用できるカウントデータには、適切なスコア規則と厳密に適切なスコア規則がいくつかあります。スコアリングルールはペナルティであるを導入し、Pは予測分布とされるYの観測値。それらには多くの望ましい特性があります。何よりもまず、真の確率に近い予測は常にペナルティが少なく、(一意の)最良の予測があり、予測される確率が真の確率と一致する場合です。したがって、s (y 、P )の期待値を最小化することは、真の確率を報告することを意味します。ウィキペディアも参照してください。s (y、P)Pys (y、P)
多くの場合、すべての予測値の平均を次のように取ります。
S= 1n∑ni = 1s (y(i )、P(i ))
どのルールを採用するかは目的によって異なりますが、それぞれのルールを使用するのが適切な場合の大まかな特性を示します。
f(y)F (Y )Σ K 0 、1 、... 、∞ I μ σPr (Y= y)F(y)∑k0 、1 、... 、∞私μσ
厳密に適切なスコアリングルール
- ブライアースコア:(カテゴリー予測子のサイズの不均衡に対して安定)s (y、P)= − 2 f(y)+ ∑kf2(k )
- Dawid-Sebastianiスコア:(一般的な予測モデルの選択に適しています;カテゴリー予測子のサイズ不均衡に対して安定)s (y、P)= (y- μσ)2+ 2 ログσ
- 逸脱スコア:(はのみに依存する正規化項です。ポアソンモデルでは、通常、飽和逸脱とみなされます。 MLフレームワーク)g y ys (y、P)= − 2 logf(y)+ gygyy
- 対数スコア:(非常に簡単に計算されます;カテゴリー予測変数のサイズ不均衡に対して安定)s (y、P)= − ログf(y)
- ランク付けされた確率スコア:(非常に高いカウントのさまざまな予測の対比に適しています;カテゴリー予測子のサイズの不均衡に影響されやすい)s (y、P)= ∑k{ F(k )− I(y≤ K )}2
- 球状スコア:(カテゴリー予測子のサイズ不均衡に対して安定)s (y、P)= f(y)∑kf2(k )√
その他のスコアリングルール(あまり適切ではないが、よく使用される)
- 絶対誤差スコア:(適切ではない)s (y、P)= | y- μ |
- 二乗誤差スコア:(厳密に適切ではない;外れ値の影響を受けやすい;カテゴリー予測子のサイズの不均衡の影響を受けやすい)s (y、P)= (y- μ )2
- ピアソンの正規化された二乗誤差スコア:(厳密には適切ではありません。外れ値の影響を受けやすい。モデルが平均スコアをチェックするかどうかのチェックに使用できます1とは大きく異なり、カテゴリカル予測子のサイズの不均衡に対して安定)s (y、P)= (y- μσ)2
厳密に適切なルールのRコードの例:
library(vcdExtra)
m1 <- glm(Freq ~ mental, family=poisson, data=Mental)
# scores for the first observation
mu <- predict(m1, type="response")[1]
x <- Mental$Freq[1]
# logarithmic (equivalent to deviance score up to a constant)
-log(dpois(x, lambda=mu))
# quadratic (brier)
-2*dpois(x,lambda=mu) + sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) })
# spherical
- dpois(x,mu) / sqrt(sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) }))
# ranked probability score
sum(ppois((-1):(x-1), mu)^2) + sum((ppois(x:10000,mu)-1)^2)
# Dawid Sebastiani
(x-mu)^2/mu + log(mu)