2つのラスター間のRMSEを段階的に


8

次の2つのラスター間のRMSE(二乗平均平方根誤差)を段階的に計算する方法を示し、得られた結果の最小値と最大値、およびそれらの解釈方法について議論できますか?

 First raster (original, 2 by 2):
 1 2
 3 4

 Second raster (obtained, 2 by 2):
 2 2
 4 1

回答:


13

計算

  1. 1つのラスターを他のラスターから減算します。(減算の方向は関係ありません。)

    -1 0
    -1 3

  2. 結果を二乗します。

    1 0
    1 9

  3. 値を平均します。

    (1 + 0 + 1 + 9)/(1 + 1 + 1 + 1) = 11/4.

    (私はあなたのGISは、この機能がない場合は不足しているデータ・セルを扱うことができる方法を示すために示唆に富む方法でこれを書いている:。他の場所では、データを持っている1と0のとインジケータグリッドを作成する割り合計して、グリッドのを合計インジケーターグリッドの値です。SpatialAnalystでは、合計をフォーカルサムとして取得できます。)

  4. 平方根を取る。

    Sqrt(11/4) = 1.66

解釈

この数は、2つのグリッド間の典型的なセルごとの差の測定値です。グリッドに数百以上の値がある場合(ほとんどの場合と同様)、グリッドは極端な値や範囲外の値を示さず、平均差は0であり、rmseを解釈するための標準的な経験則は次のとおりです。

  • すべてのセルの約2/3はrmse未満で異なります。

  • すべてのセルの約95%は、rmseの2倍未満の違いがあります。

  • rmseの3倍以上の違いが見られることはまれです。

任意のサイズのグリッド(では例えば、百万個の細胞)、「珍しい」はまだ数千の細胞に変換します。それらのすべての百分の一の割合周り。

例では、これは非常に小さいですが、4つのセルがあり、rmseが1.66であることを知っているので、「約2/3-セルの2または3-が1.66内で一致する」と考えます。 2 * 1.66 = 3.32。以内に同意する ステップ(1)の結果からわかるように、実際の状況は、セルの3/4が1.66以内で一致し、それらすべてが実際に3以内で一致することです。

グリッドが大きく異なり、値の範囲が非常に広い場合、経験則に疑いを抱くかもしれません。チェビシェフの不等式あなたはまだことを知っています

  • rmseの2倍を超える違いは、セルの1/4以下です。

  • わずか1/9のセルの差がrmseの3倍を超えません。

  • 一般に、2以上の任意の数kを選択します。1 / k ^ 2以下のセルの違いは、rmseのk倍以上です。

これは普遍的な規則であり、グリッドの任意のペアに有効ですが、以前の経験則では、セル差の分布は、多くの極端な外れ値のないほぼ「ベル型」であると想定しています。

編集する

上記の解釈は、測定誤差まで同じものを表すことを目的とした2つのグリッドを比較し、それらの平均差がゼロ(またはそれに十分近い)であることを前提としています。平均差が(rmseと比較して)かなりある場合、これらの解釈は正しくありませんが、rmseを使用しても意味がありません。代わりに、(a)平均差を報告し、(b)ステップ(3)の後にその二乗を差し引きます。これにより、平均二乗ではなく、平均二乗残差が得られます。その平方根は、2つのグリッド間の平均的な差異に対する変動の典型的なサイズです。この警告により、解釈は以前と同じ経験則を使用できます。


@whuber:ありがとうございました!!! このプロセスを詳細に説明している本はありますか?それとも紙?参照として。もう一度感謝します!!! 本当に感謝しています。

@whuber:次のラスターがある場合、計算はどのように変化しますか、raster1(3 by 3)= {{1,2、-9999}、{2,3、-9999}、{4,5、-9999}} 、raster2(3 x 3)= {{2,2、-9999}、{-9999,3,4}、{-9999、-9999、-9999}}。ここで、データ値は-9999ではありません。どうもありがとう!!!

@opl 2つの等しい{{-1,0、Null}、{Null、0、Null}、{Null、Null、Null}}。したがって、平方差は{{1,0、Null}、{Null、0、Null}、{Null、Null、Null}}に等しく、インジケーターは{{1,1、Null}、{Null、1、Null}に等しくなります。 、{Null、Null、Null}}。それらの合計はそれぞれ1と3で、平均二乗は1/3で、rmsはSqrt(1/3)です。
whuber

@whuber:結果の「rmse」値が特定の範囲にあると言うことは可能ですか?たとえば、最小0と最大10 ... つまり、それが最小値に近い場合はそれが優れていると言え、最大値に近い場合は大幅に逸脱している、またはその逆です。前もって感謝します!

@opl通常、グリッドがどのように変化する可能性があるかを理解していない限り、事前にrmseを予測することはできません。たとえば、各グリッドのメタデータは、真実からの逸脱の可能性を定量的に示します。たとえば、それぞれがDEMであり、1つは+ -15 mの垂直誤差を示し、もう1つは+ -20 mの垂直誤差を示しています。これらを標準偏差の大まかな目安として、それらを組み合わせてSqrt(15 ^ 2 + 20 ^ 2)= 25 mの相対誤差を推定できます。この場合、2つの間のrmseは約25 mになると予想します。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.