RMSE対決定係数


21

物理モデルを評価していますが、ここで使用する方法の1つ(RMSEと決定係数R2の間)を知りたい

問題は以下の通りである:私は、入力値xのための出力の予測、その機能を有するyx¯=f(x)。また、と呼ばれるその値の実際の観測値もありyxます。

私の質問は、RMSEまたはの長所と短所は何ですかR2。私が取り組んでいる問題のために、それらの両方が論文で使用されているのを見ました。

回答:


16

私は両方を使用しましたが、いくつかのポイントがあります。

  • Rmseは、説明が簡単なので便利です。誰もがそれが何であるかを知っています。
  • Rmseは相対値を表示しません。場合、範囲α < y x < βを明確に知る必要があります。場合α = 1 β = 1000年、次いで0.2良い値です。もしα = 0 β = 1、それはもうあまりよくないようではありません。rmse=0.2α<yx<βα=1,β=1000α=0,β=1
  • 前のアプローチと同じように、rmseは、調査した人や測定値がほぼ均一(誰もが製品を3つ星で評価した)であるという事実を隠す良い方法です。データが少しランダムな場合、モデルが木星を周回していることがわかります。
  • 通常のR 2ではなく、調整された決定係数を使用するR2
  • 決定係数の説明は困難です。現場の人々でさえ、\ footnoteのような脚注のヒントが必要です{調整された決定係数は、統計モデルで説明できるデータセットの変動の割合です。この値は、モデルが将来の結果をどれだけうまく予測できるかを示しています。は最小値として0、最大値として1を取ることができます。}R2
  • ただし、決定係数は、モデルが現象をどの程度うまく説明しているかを正確に伝えるのに非常に正確です。場合、y x値に関係なく、モデルは不良です。優れたモデルのカットオフポイントは0.6から始まり、0.7〜0.8程度の値があれば、そのモデルは非常に優れていると思います。R2=0.2yx
  • 要約すると、は、モデルを使用すると、実際のデータで行われていることの70%を説明できると言います。残りの30%は、あなたが知らない何かであり、説明することはできません。これはおそらく、交絡要因があるか、モデルの構築でいくつかの間違いを犯したためです。R2=0.7
  • コンピューターサイエンスでは、ほぼ全員がrmseを使用します。社会科学はより頻繁に使用します。R2
  • モデルのパラメーターを正当化する必要がない場合は、rmseを使用してください。ただし、モデルの構築中にパラメーターを入力、削除、または変更する必要がある場合は、を使用して、これらのパラメーターがデータを最もよく説明できることを示す必要があります。R2
  • を使用する場合は、R言語でコーディングします。ライブラリがあり、すべての結果を得るためにデータを与えるだけです。R2

意欲的なコンピューター科学者にとって、統計について書くのはスリルがありました。敬具。


8
This value shows how well future outcomes can be predicted by the model-これは非常に誤解を招くもので、単なる間違いに傾いてます。特定のモデルの高い決定係数が、将来の結果がどれだけうまく予測されるかに関係するという保証はありません。
Prophet60091 14年

5
R 2 = 0.2ならモデルは悪いR2=0.2」、「あなたのモデルは非常に良いR2=0.70.8」などの文は、大まかな一般化だと思います。現実世界の問題のために何がいる場合 0.8のを強く疑い過学習の問題になるだろう...R2
usεr11852は回復モニック言う

3
= 0.2の場合、yx値に関係なく、モデルは不良です。優れたモデルのカットオフポイントは0.6から始まり、0.7〜0.8程度の値があれば、そのモデルは非常に優れていると思います。これは、作業している分野に大きく依存します。来年のスタック交換関連インデックスを予測しようとすると想像してください。あなたは0.2のR 2で世界で最も裕福な人になります。R2R2
ヤンハッケンバーグ

Jan HackenbergとProphet60091に同意します。あなたの答えの一部は明確に間違っており、なぜこれが受け入れられた答えであり、人々が支持しているのか私は理解していません。実際、これはおそらく、人々がメトリックを解釈する方法を知らずにメトリックを使用していることを意味します。
Cord Kaldemeyer

9

どのようなエラー測定を行っても、完全な結果ベクトルを付録に記載することを検討してください。メソッドと比較したいが、別のエラー測定を好む人は、テーブルからそのような値を導き出すことができます。

R2

  • 体系的なエラーを反映していません。円形オブジェクトの半径ではなく、直径を測定すると想像してください。予想される過大評価は100%ですが、1に近いに到達する可能性があります。R2

  • を理解するのは難しいという以前のコメントに反対します。値が高いほど、モデルはより正確になりますが、体系的なエラーが含まれることがあります。R2

  • 平方残差の合計の比率を構築し、平均で除算するわかりやすい式で表すことができます。

R2=1SSEmean=1(yiyi¯)2(yiy¯)2

  • より高度なバージョンで表現する必要があります。ここでは、より多くの予測変数がモデルを罰します。過剰適合に対してより堅牢であることが期待されます。Radj.2

RMSE

  • 高い精度(単一ではあるが大きな外れ値は厳しく罰する)と系統誤差がないことの両方によってのみ、低い到達できます。ある意味では、低いR M S Eは高いR 2よりも優れた品質を実現します。RMSERMSER2

  • rel.RMSErel.RMSE

他の人が言ったように、選択はあなたの分野と最先端に依存するかもしれません。比較するために広く受け入れられている方法もありますか?それらと同じ測定を使用すると、議論の中でメソッドの利点を簡単に直接リンクできます。


7

R2

両方のメトリックの違いを理解するための非常に一般的なガイドとして、次を使用します。

RMSEは、あなたの予測値は、あなたがモデルにしようとしている実際のデータからどれだけ近いか(または遠)の感覚を与えます。これは、モデルの予測の精度と精度(モデリングツリーの高さなど)を理解したいさまざまなアプリケーションで役立ちます。

長所

  1. 報告された値は、モデル化されている従属変数と同じ単位であるため、理解と通信は比較的簡単です。

短所

  1. 大きなエラーに敏感です(小さな予測エラーよりも大きな予測エラーにペナルティを科します)。

R2

長所

  1. 選択した変数がデータにどの程度適合するかを全体的に把握できます。

短所

  1. R2R2

もちろん、上記はサンプルサイズとサンプリング設計、および相関関係が因果関係を意味しないという一般的な理解の対象となります。


1

MAE、平均絶対誤差もあります。RMSEとは異なり、大きなエラーに対してあまり敏感ではありません。私が読んだことから、いくつかのフィールドはRMSEを好み、他のフィールドはMAEを好みます。私は両方を使うのが好きです。


0

実際、統計学者はモデルの最適な適合を知る必要があるため、RMSEは堅牢な研究の人々にとって非常に重要です。RMSEがゼロに非常に近い場合、モデルは最適な適合です。

決定係数は、農業や他の分野のような他の科学者に適しています。0〜1の値です。1の場合、値の100%が観測データセットに一致します。0の場合、データは完全に異種です。Dr.SK.Khadar Babu、VIT大学、Vellore、タミルナドゥ、インド


0

いずれかのベクトルの各要素に数値が追加されると、RMSEが変わります。一方または両方のベクトルのすべての要素に数値を乗算する場合も同じです。Rコードが続きます。

#RMSE vs pearson's correlation
one<-rnorm(100)
two<-one+rnorm(100)

rumis<-(two - one)^2
(RMSE<-sqrt(mean(rumis)))
cor(one,two)

oneA<-one+100

rumis<-(two - oneA)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneA,two)

oneB<-one*10
twoB<-two*10

rumis<-(twoB - oneB)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneB,twoB)
cor(oneB,twoB)^2

0

RMSEに観測値の数を掛けたものが分子またはRの2乗であり、後者の分母はすべてのモデルで一定であるため、最終的に両者は同じモデルの選択につながるため、標準化のみです。 10種類のモデルのその他)。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.