二乗平均平方根誤差と平均バイアス偏差の概念的理解


13

ルート平均二乗誤差(RMSE)および平均バイアス偏差(MBD)の概念を理解したいと思います。データを自分で比較するためにこれらの測定値を計算すると、RMSEが高い(たとえば100 kg)のに対し、MBDが低い(たとえば1%未満)ことに気づいて困惑することがよくあります。

より具体的には、これらの測定の数学をリストして説明するリファレンス(オンラインではない)を探しています。これらの2つの測定値を計算するために通常受け入れられている方法は何ですか。また、それらをジャーナルの論文でどのように報告すべきですか。

この投稿のコンテキストでは、これらの2つのメジャーの計算を説明するために使用できる「おもちゃ」データセットがあると、本当に役立ちます。

たとえば、組立ラインで生成された200個のウィジェットの質量(kg単位)を検索するとします。これらのウィジェットの質量を予測しようとする数学モデルもあります。モデルは経験的である必要はなく、物理ベースにすることができます。実際の測定値とモデルの間でRMSEとMBDを計算すると、RMSEが100 kgでMBDが1%であることがわかります。これは概念的に何を意味し、この結果をどのように解釈しますか?

この実験の結果から、RMSEが10 kg、MBDが80%であることがわかりました。これは何を意味し、この実験について何が言えますか?

これらの対策の意味は何ですか?また、2つ(まとめて)は何を意味しますか?RMSEで検討した場合、MBDはどのような追加情報を提供しますか?


2
ニコラスのサイトを見回したことがありますか?stats.stackexchange.com/a/17545から始めて、質問に追加したタグのいくつかを調べてみてください。
whuber

@whuber:ありがとうwhuber !. サイトを見回しましたが、私にとっては、自分の研究の文脈で何が本当に意味されるのかを理解するのはまだ少し難しいと感じています。
ニコラスキナー

回答:


20

これらの概念は簡単に説明できると思います。ですから、ここで説明したいだけです。私の本「医師、看護師、臨床医のための生物統計学の要点」を含む多くの初歩的な統計の本がこれをカバーしていると確信しています。

中央にブルズアイのあるターゲットを考えてください。平均二乗誤差は、ターゲットと中心に照射された矢印からの平均二乗距離を表します。矢印が中央に均等に散らばっている場合、シューターには照準バイアスがなく、平均二乗誤差は分散と同じです。

しかし、一般的に矢印はターゲットから離れた点の周りに散らばることがあります。矢印の中心からの矢印の平均平方距離が分散です。このセンターは、射手が狙うポイントとして見ることができます。このシューティングゲームの中心または照準点からターゲットの中心までの距離は、バイアスの絶対値です。

斜辺の正方形が2辺の平方和である直角三角形について考えます。したがって、矢印からターゲットまでの距離の2乗は、矢印から照準点までの距離の2乗、およびターゲットの中心と照準点の間の距離の2乗です。これらのすべての二乗距離を平均すると、バイアス二乗と分散の合計として平均二乗誤差が得られます。


ありがとうございました; これは大歓迎です。RMSEとMBDの違いを理解することは、まだ少し難しいと感じています。私が理解しているように、RMSEはモデルが実験データにどれだけ近いかを定量化しますが、MBDの役割は何ですか?たぶん私の誤解は用語に関連しているだけかもしれません。
ニコラス・キナー

1
あなたがそれを呼ぶときの平均バイアス偏差は、私が説明したバイアス項です。目標からターゲットまでの距離を測定します。バイアスは、ショットを不正確にする原因となります。
マイケルR.チャーニック

マイケル、ありがとう。それで、高いRMSEと低いMBDは、それが良いモデルであることを意味しますか?
ニコラスキナー

RMSEが高くMBDが低いということは、大きなバイアスではなく、大きな分散のためにモデルが貧弱であるというだけではありません。RMSEは、モデルの品質を決定する数値です。
マイケルR.チェルニック

1
@bbadyalina:上/下と左/右が独立しているのと同じように、それらは独立した情報です。あなたの質問は、「点が垂直方向に中央にあり、左にずれている場合、それは中央にあるのか?」と尋ねるようなものです。、または「ポイントが高く、水平方向の中央にある場合、それは中央にありますか?」
naught101

1

RMSEは、予測モデルが実際のデータに対してどれだけ良好であるかを測定する方法です。RMSEが小さいほど、モデルの動作は良くなります。つまり、トレーニングセットではなく新しいデータセットでテストしますが、 0〜1の範囲でRMSEが0.37である場合、0.01のRMSEがより良いモデルであるのに対して、多くのエラーが発生します。BIASは過大評価または過小評価のためのものです。


詳細と解決された例を提供してください。OPは、推定問題に対する、たとえば100のRMSEの意味の直感的な説明を探しています。
西安

これは多くの直観をもたらさないようです。もっと説明してもらえますか?
Glen_b-モニカを復活させる

0

私が理解できる限りでは、RMSEはモデルと観測されたエラーのより正確な値を与えますが、BIASはエラーの値を与えることに加えて(RMSEよりも正確ではありません)、モデルがモデルが観測値を過小評価または過大評価している場合、正のバイアスまたは負のバイアス。


いいえ。RMSEは、モデルの「精度」と考えることができます。たとえば、予測の誤差にどれだけの広がりがあるか(注:精度は分散の逆数-高分散=低精度)。また、バイアスはモデルの体系的なエラー、たとえばすべてのエラーの平均値と考えることができます。「精度」という作業は、これら両方のあいまいな組み合わせであるため、多くの混乱を引き起こします。
-naught101
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.