1
RMSEに基づいて精度測定を計算する方法は?大規模なデータセットは通常に配布されますか?
何千ものポイントのデータセットがいくつかあります。各データセットの値は、空間の座標を参照するX、Y、Zです。Z値は、座標ペア(x、y)での標高差を表します。 通常、私のGISの分野では、標高誤差は、RMSEでグラウンドトゥルースポイントを測定ポイント(LiDARデータポイント)に差し引くことで参照されます。通常、最低20のグラウンドトゥルーシングチェックポイントが使用されます。このRMSE値を使用して、NDEP(National Digital Elevation Guidelines)およびFEMAガイドラインに従って、精度の尺度を計算できます:精度= 1.96 * RMSE。 この基本精度は、「基本垂直精度とは、データセット間で垂直精度を公平に評価および比較できる値です。基本精度は、垂直RMSEの関数として95%の信頼水準で計算されます。」 正規分布曲線の下の面積の95%が1.96 * std.deviation内にあることを理解していますが、それはRMSEとは関係ありません。 一般的に私はこの質問をしています:2つのデータセットから計算されたRMSEを使用して、RMSEをある種の精度(つまり、データポイントの95%が+/- X cm以内にある)に関連付けるにはどうすればよいですか?また、このような大きなデータセットでうまく機能するテストを使用して、データセットが通常は分散されているかどうかをどのように判断できますか?正規分布にとって「十分」とは何ですか?すべての検定でp <0.05にする必要がありますか、それとも正規分布の形状と一致させる必要がありますか? 次の論文で、このトピックに関する非常に優れた情報を見つけました。 http://paulzandbergen.com/PUBLICATIONS_files/Zandbergen_TGIS_2008.pdf