RMSEの信頼区間


20

母集団からデータポイントのサンプルを取得しました。これらの各ポイントには、真の値(グラウンドトゥルースから既知)と推定値があります。次に、各サンプリングポイントの誤差を計算し、サンプルのRMSEを計算します。n

次に、サンプルサイズ基づいて、このRMSEの周りのある種の信頼区間をどのように推測できますか?n

RMSEではなく平均を使用していた場合、標準方程式を使用できるので、これを行うのに問題はありません。

m=Zσn

しかし、これが平均ではなくRMSEに有効かどうかはわかりません。これを適応させる方法はありますか?

(私はこの質問を見ましたが、私の人口が通常分布しているかどうかの問題はありません、それはそこでの答えが扱っているものです)


「サンプルのRMSEを計算する」とき、具体的に何を計算しますか?それはのRMSEで、真値推定値、またはその違いの?
whuber

2
差のRMSEを計算しています。つまり、真の値と推定値の差の2乗の平均の平方根を計算しています。
-robintw

「グランドトゥルース」を知っている場合(実際にはどういう意味かはわかりませんが)、なぜRMSEの不確実性が必要なのでしょうか?あなたはグラウンドトゥルースを持っていない場合について何らかの推論を構築しようとしていますか?これはキャリブレーションの問題ですか?
Glen_b-モニカの復活2013

@Glen_b:うん、それはまさに私たちがやろうとしていることです。サンプルだけについては、母集団全体についての根拠はありません。次に、サンプルのRMSEを計算します。このサンプルを使用して母集団のRMSEを推測するため、これに信頼区間を設定します。
robintw

回答:


15

ここと同様の推論、特定の条件下であなたの質問に答えることができるかもしれません。

レッツは、のためにあなたの本当の値であることがのt 時間データポイントおよびxは私に推定値を。推定値と真の値の差がバツthバツ^

  1. 平均ゼロ(すなわち、X iは周りに分散されているが、xはIをバツ^バツ

  2. 正規分布に従う

  3. すべてが同じ標準偏差σを持ちますσ

要するに:

バツ^バツN0σ2

信頼区間が本当に必要です。σ

上記の仮定がn RMSE 2に当てはまる 以下のχ 2 n個有する分布N(ないN-1自由度)を。これの意味は

nRMSE2σ2=n1ni(xi^xi)2σ2
χn2nn1

P(χα2,n2nRMSE2σ2χ1α2,n2)=1αP(nRMSE2χ1α2,n2σ2nRMSE2χα2,n2)=1αP(nχ1α2,n2RMSEσnχα2,n2RMSE)=1α.

したがって、 は信頼区間です。

[nχ1α2,n2RMSE,nχα2,n2RMSE]

これはあなたの状況をシミュレートするpythonプログラムです

from scipy import stats
from numpy import *
s = 3
n=10
c1,c2 = stats.chi2.ppf([0.025,1-0.025],n)
y = zeros(50000)
for i in range(len(y)):
    y[i] =sqrt( mean((random.randn(n)*s)**2))

print "1-alpha=%.2f" % (mean( (sqrt(n/c2)*y < s) & (sqrt(n/c1)*y > s)),)

お役に立てば幸いです。

仮定が当てはまるかどうかわからない場合や、私が書いたものを別の方法と比較したい場合は、常にbootstrappingを試すことができます。


1
あなたは間違っていると思います-彼はではなくRMSEのCIを望んでいます。そして、私もそれが欲しいです :)σ
好奇心が

1
私は間違っているとは思わない。ただ、このようにそれについて考える:MSEが実際以来、標本分散でMSE=σ^2=1ni=1n(xix^i)2nn1σσ

10

The reasoning in the answer by fabee seems correct if applied to the STDE (standard deviation of the error), not the RMSE. Using similar nomenclature, i=1,,n is an index representing each record of data, xi is the true value and x^i is a measurement or prediction.

The error ϵi, BIAS, MSE (mean squared error) and RMSE are given by:

ϵi=x^ixi,BIAS=ϵ¯=1ni=1nϵi,MSE=ϵ2¯=1ni=1nϵi2,RMSE=MSE.

Agreeing on these definitions, the BIAS corresponds to the sample mean of ϵ, but MSE is not the biased sample variance. Instead:

STDE2=(ϵϵ¯)2¯=1ni=1n(ϵiϵ¯)2,
or, if both BIAS and RMSE were computed,
STDE2=(ϵϵ¯)2¯=ϵ2¯ϵ¯2=RMSE2BIAS2.
Note that the biased sample variance is being used instead of the unbiased, to keep consistency with the previous definitions given for the MSE and RMSE.

Thus, in my opinion the confidence intervals established by fabee refer to the sample standard deviation of ϵ, STDE. Similarly, confidence intervals may be established for the BIAS based on the z-score (or t-score if n<30) and STDE/n.


2
You are right, but missed a part of my answer. I basically assumed that BIAS=0 (see assumption 1). In that case, RMSE2=STDE2 as you derived. Since both RMSE2 and BIAS2 are χ2 and there exists a close form solution for the sum of two χ2 RVs, you can probably derive a close form confidence interval for the case when assumption 1 is dropped. If you do that and update your answer, I'll definitely upvote it.
fabee

0

Following Faaber 1999, the uncertainty of RMSE is given as

σ(RMSE^)/RMSE=12n
where n is the number of datapoints.
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.