回答:
私は両方を使用しましたが、いくつかのポイントがあります。
意欲的なコンピューター科学者にとって、統計について書くのはスリルがありました。敬具。
どのようなエラー測定を行っても、完全な結果ベクトルを付録に記載することを検討してください。メソッドと比較したいが、別のエラー測定を好む人は、テーブルからそのような値を導き出すことができます。
:
体系的なエラーを反映していません。円形オブジェクトの半径ではなく、直径を測定すると想像してください。予想される過大評価は100%ですが、1に近いに到達する可能性があります。
を理解するのは難しいという以前のコメントに反対します。値が高いほど、モデルはより正確になりますが、体系的なエラーが含まれることがあります。
平方残差の合計の比率を構築し、平均で除算するわかりやすい式で表すことができます。
:
高い精度(単一ではあるが大きな外れ値は厳しく罰する)と系統誤差がないことの両方によってのみ、低い到達できます。ある意味では、低いR M S Eは高いR 2よりも優れた品質を実現します。
他の人が言ったように、選択はあなたの分野と最先端に依存するかもしれません。比較するために広く受け入れられている方法もありますか?それらと同じ測定を使用すると、議論の中でメソッドの利点を簡単に直接リンクできます。
両方のメトリックの違いを理解するための非常に一般的なガイドとして、次を使用します。
RMSEは、あなたの予測値は、あなたがモデルにしようとしている実際のデータからどれだけ近いか(または遠)の感覚を与えます。これは、モデルの予測の精度と精度(モデリングツリーの高さなど)を理解したいさまざまなアプリケーションで役立ちます。
長所
短所
長所
短所
もちろん、上記はサンプルサイズとサンプリング設計、および相関関係が因果関係を意味しないという一般的な理解の対象となります。
実際、統計学者はモデルの最適な適合を知る必要があるため、RMSEは堅牢な研究の人々にとって非常に重要です。RMSEがゼロに非常に近い場合、モデルは最適な適合です。
決定係数は、農業や他の分野のような他の科学者に適しています。0〜1の値です。1の場合、値の100%が観測データセットに一致します。0の場合、データは完全に異種です。Dr.SK.Khadar Babu、VIT大学、Vellore、タミルナドゥ、インド
いずれかのベクトルの各要素に数値が追加されると、RMSEが変わります。一方または両方のベクトルのすべての要素に数値を乗算する場合も同じです。Rコードが続きます。
#RMSE vs pearson's correlation
one<-rnorm(100)
two<-one+rnorm(100)
rumis<-(two - one)^2
(RMSE<-sqrt(mean(rumis)))
cor(one,two)
oneA<-one+100
rumis<-(two - oneA)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneA,two)
oneB<-one*10
twoB<-two*10
rumis<-(twoB - oneB)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneB,twoB)
cor(oneB,twoB)^2
This value shows how well future outcomes can be predicted by the model
-これは非常に誤解を招くもので、単なる間違いに傾いています。特定のモデルの高い決定係数が、将来の結果がどれだけうまく予測されるかに関係するという保証はありません。