タグ付けされた質問 「rms」

3
平均絶対誤差または二乗平均平方根誤差?
なぜ平均絶対誤差(MAE)ではなく、ルート平均二乗誤差(RMSE)を使用するのですか? こんにちは 計算で生成されたエラーを調査してきました。最初は、エラーをルート平均正規化二乗誤差として計算しました。 少し詳しく見てみると、誤差を2乗すると、小さい誤差よりも大きい誤差の方が重みが大きくなり、誤差の推定値が奇数の外れ値に向かって歪んでいます。振り返ってみると、これは非常に明白です。 だから私の質問-どのような場合に二乗平均平方根誤差は平均絶対誤差よりも適切な誤差の尺度になるでしょうか?後者は私にとってより適切であると思われますか、何か不足していますか? これを説明するために、以下の例を添付しました。 散布図は、良好な相関関係を持つ2つの変数を示しています。 右のグラフの2つのヒストグラムは、正規化されたRMSE(上)とMAE(下)を使用したY(観測値)とY(予測値)の間の誤差です。 このデータには重要な異常値はなく、MAEはRMSEよりも低いエラーを示します。MAE以外が望ましい、一方のエラー測定値をもう一方よりも使用するための合理的なものはありますか?
59 least-squares  mean  rms  mae 

1
エラー対策の解釈方法は?
Wekaで特定のデータセットに対して分類を実行していますが、公称値を予測しようとすると、出力に正確に予測された値と誤って予測された値が明確に表示されることに気付きました。ただし、現在は数値属性に対して実行しており、出力は次のとおりです。 Correlation coefficient 0.3305 Mean absolute error 11.6268 Root mean squared error 46.8547 Relative absolute error 89.2645 % Root relative squared error 94.3886 % Total Number of Instances 36441 これをどうやって解釈しますか?私はそれぞれの概念をグーグルで試しましたが、統計は私の専門分野ではまったくないため、あまり理解していません。統計の観点からELI5タイプの回答をいただければ幸いです。

3
二乗平均平方根誤差(RMSE)と標準偏差の解釈方法
予測値を提供するモデルがあるとしましょう。これらの値のRMSEを計算します。そして、実際の値の標準偏差。 これらの2つの値(分散)を比較するのは意味がありますか?私が思うに、RMSEと標準偏差が類似/同じであれば、私のモデルの誤差/分散は実際に起こっていることと同じです。しかし、これらの値を比較しても意味がない場合、この結論は間違っている可能性があります。私の考えが本当なら、それはモデルがそれが分散を引き起こしているものを帰することができないので、それができる限り良いことを意味しますか?最後の部分はおそらく間違っているか、少なくとも答えるにはさらに情報が必要だと思います。

2
MAEを最小化すると、平均ではなく中央値が予測されるのはなぜですか?
予測:原則と実践は、ロブ・J HyndmanとジョージAthanasopoulos教科書、特に精度測定上のセクション: MAEを最小化する予測方法は中央値の予測につながり、RMSEを最小化すると平均の予測につながります MAEを最小化すると平均ではなく中央値が予測される理由を直感的に説明できますか?そして、これは実際には何を意味しますか? お客様に、「平均予測をより正確にする、または非常に不正確な予測を避けるために、あなたにとってより重要なことは何ですか?」と尋ねました。彼は、平均予報をより正確にするために、より高い優先度を持っていると言いました。したがって、この場合、MAEまたはRMSEを使用する必要がありますか?この引用を読む前に、私はMAEがそのような状態に良くなると信じていました。そして今、私は疑います。
19 forecasting  mean  median  rms  mae 

2
相互検証と順序ロジスティック回帰
順序ロジスティック回帰の相互検証を理解しようとしています。ゲームの目的は、分析で使用されるモデルを検証することです... 最初に、おもちゃのデータセットを作成します。 set.seed(1) N <- 10000 # predictors x1 <- runif(N) x2 <- runif(N) x3 <- runif(N) # coeffs in the model a <- c(-2,-1) x <- -x1+2*x2+x3 # P( y ≤ i ) is given by logit^{-1} ( a[i]+x ) p <- outer(a,x, function(a,x) 1/(1+exp(-a-x)) ) # computing the …

1
母集団のRMSEと標準偏差
RMSE(二乗平均平方根誤差)とSD(標準偏差)の式は似ています。 このリンクは言う 唯一の違いは、あなたがで割ることで ない のn - 1あなたがここにサンプルの平均を引いていないので。RMSEはσに対応し ます。したがって、母集団RMSEはσで あり、そのための CIが必要です。んnnn − 1n−1n−1σσ\sigmaσσ\sigma RMSEとSDが同じかどうかを知りたいのですが。また、参考にさせていただきます。

2
ロジスティックモデルのRMSE(二乗平均平方根誤差)
RMSE(二乗平均平方根誤差)を使用してさまざまなロジスティックモデルを比較することの妥当性について質問があります。応答のいずれかである0か1との予測が間確率でありますか0- 1? 以下に適用される方法は、バイナリ応答でも有効ですか? # Using glmnet require(glmnet) load(url("https://github.com/cran/glmnet/raw/master /data/BinomialExample.RData")) cvfit = cv.glmnet(x, y, family = "binomial", type.measure = "mse") A <- predict(cvfit, newx = x, s = "lambda.min", type = "response") RMSE1 <- mean((y - A)^2) # 0.05816881 # glm mydata <- read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv") mydata$rank <- factor(mydata$rank) mylogit <- glm(admit ~ …

2
正規化されたRMSE
VAR(1)にいくつかの時系列があり、それらのいくつかは同じ測定単位を持たないため、RMSEをパーセンテージで推定したいと思います。私はそれがいくつかの方法で行われる可能性があることを知っています(以下を参照)。しかし、どれが予測評価の問題によりよく適合するかは正確にはわかりません。あなたが助けてくれるといいのですが。 正規化されたRMSEの例: R MSE1= 1んΣ私(Yfo r e c a s t私− Y私Y私)2−−−−−−−−−−−−−−−−−−−⎷R MSE2= 1んΣ私(Yfo r e c a s t私− Y私Yfo r e c a s t私)2−−−−−−−−−−−−−−−−−−−⎷R MSE3= 1んΣ私(Yfo r e c a s t私− Y私)2−−−−−−−−−−−−−−−−−√m e a n (Y)RMSE1=1n∑i(Yforecasti−YiYi)2RMSE2=1n∑i(Yforecasti−YiYforecasti)2RMSE3=1n∑i(Yforecasti−Yi)2mean(Y) RMSE_1 = \sqrt{\frac{1}{n}\sum_i\left(\frac{Y_{forecast_i}-Y_i}{Y_i}\right)^2} \\ RMSE_2 = \sqrt{\frac{1}{n}\sum_i\left(\frac{Y_{forecast_i}-Y_i}{Y_{forecast_i}}\right)^2} \\ RMSE_3 = …
10 time-series  mse  rms 


1
相互に排他的でないカテゴリを分類できる深層学習モデル
例:仕事の説明に「英国のJavaシニアエンジニア」という文があります。 私は2つのカテゴリとして、それを予測することは、深い学習モデルを使用したい:English とIT jobs。従来の分類モデルを使用する場合softmax、最後のレイヤーで機能を持つ1つのラベルのみを予測できます。したがって、2つのモデルのニューラルネットワークを使用して、両方のカテゴリで「はい」/「いいえ」を予測できますが、さらに多くのカテゴリがあると、コストがかかりすぎます。では、2つ以上のカテゴリを同時に予測するためのディープラーニングまたは機械学習モデルはありますか? 「編集」:従来のアプローチによる3つのラベルでは、[1,0,0]によってエンコードされますが、私の場合、[1,1,0]または[1,1,1]によってエンコードされます 例:3つのラベルがあり、文がこれらすべてのラベルに収まる場合。したがって、softmax関数からの出力が[0.45、0.35、0.2]である場合、3つのラベルまたは2つのラベルに分類する必要がありますか、それとも1つにすることができますか?それを行うときの主な問題は、1、2、または3つのラベルに分類するための適切なしきい値は何ですか?
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
コックス比例ハザードに複数の代入を使用してから、rmsパッケージで検証しますか?
私はマウスパッケージを研究していますが、複数の代入を使用してCoxモデルを作成し、そのモデルをrmsパッケージのvalidate()機能で検証する方法をまだ発見していません。データセットを使用した、これまでのサンプルコードを次に示しますveteran。 library(rms) library(survival) library(mice) remove(veteran) data(veteran) veteran$trt=factor(veteran$trt,levels=c(1,2)) veteran$prior=factor(veteran$prior,levels=c(0,10)) #Set random data to NA veteran[sample(137,4),1]=NA veteran[sample(137,4),2]=NA veteran[sample(137,4),7]=NA impvet=mice(veteran) survmod=with(veteran,Surv(time,status)) #make a CPH for each imputation for(i in seq(5)){ assign(paste("mod_",i,sep=""),cph(survmod~trt+celltype+karno+age+prior, data=complete(impvet,i),x=T,y=T)) } #Now there is a CPH model for mod_1, mod_2, mod_3, mod_4, and mod_5. さて、CPHモデルを1つだけ使用していた場合は、次のようにします。 validate(mod_1,B=20) 私が抱えている問題は、5つのCPHモデル(代入ごとに1つ)を取得し、で使用できるプールされたモデルを作成する方法rmsです。miceパッケージにいくつかの組み込みのプール関数があることは知っていますが、それらがのcphオブジェクトで機能するとは思いませんrms。ここでのキーはrms、プール後も引き続き使用できることです。私はハレルのaregImpute()関数の使用を調査しましたが、例とドキュメントに従っていくらか問題があります。 mice使用する方が簡単なようです。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.