タグ付けされた質問 「r-squared」

決定係数は、通常、 R2は、回帰モデルによって説明される全応答分散の割合です。また、たとえばロジスティック回帰(および他のモデル)など、提案されたさまざまな疑似R 2乗にも使用できます。

3
高い役に立たないでしょうか?
この質問は、相互検証で回答できるため、Stack Overflowから移行されました。 3年前に移行され ました。 統計では、線形回帰を開始しています。一般に、が高いほど良いことはわかっていますが、が高いと役に立たないシナリオはありますか?R2R2R^2R2R2R^2

2
分位点回帰モデルの調整済みようなものはありますか?
論文に変位値回帰モデルを含めたので、査読者は、調整済みのを論文に含めたいと思っています。私の研究で興味のある3つの分位数について、疑似を計算しました(KoenkerとMachadoの1999 JASA論文から)。R2R2R^2R2R2R^2 ただし、分位点回帰用に調整されたについて聞いたことがなく、その計算方法がわかりません。次のいずれかをお願いします。R2R2R^2 好ましくは、分位点回帰の調整済みを有意義に計算する方法に関する式またはアプローチ。R2R2R^2 あるいは、分位点回帰で調整されたようなものがない理由について、レビューアーに提供する説得力のある議論。R2R2R^2

2
分位点回帰におけるR二乗
変位値回帰を使用して、データの90パーセンタイルの予測変数を見つけています。これをRでquantregパッケージを使用して行っています。予測変数によってどの程度の変動が説明されているかを示す変位値回帰のを決定するにはどうすればよいですか?r2r2r^2 私が本当に知りたいこと:「どの程度の変動性が説明されているかを見つけるために使用できる方法は?」P値による有意水準は、コマンドの出力で使用可能です:summary(rq(formula,tau,data))。どうすればフィット感を得ることができますか?

4
重回帰における予測変数の重要性:部分対標準化係数
部分モデルと線形モデルの係数との正確な関係と、因子の重要性と影響を説明するためにどちらか一方のみを使用すべきかどうか疑問に思っています。R2R2R^2 私が知る限りsummary、係数の推定値を取得しanova、各因子の平方和を取得します-1つの因子の平方和を平方和と残差の合計で割った割合は部分(次のコードはにあります)。R2R2R^2R library(car) mod<-lm(education~income+young+urban,data=Anscombe) summary(mod) Call: lm(formula = education ~ income + young + urban, data = Anscombe) Residuals: Min 1Q Median 3Q Max -60.240 -15.738 -1.156 15.883 51.380 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.868e+02 6.492e+01 -4.418 5.82e-05 *** income 8.065e-02 9.299e-03 8.674 2.56e-11 *** young 8.173e-01 …

1
通常、相関係数は大文字の記述されますが、そうでない場合もあります。r 2とR 2の間に本当に違いがあるのだろうか?缶R相関係数よりも、他の平均何か?RRRr2r2r^2R2R2R^2rrr

6
単純な線形回帰出力の解釈
2つの変数の自然対数の単純な線形回帰を実行して、それらが相関しているかどうかを判断しました。私の出力はこれです: R^2 = 0.0893 slope = 0.851 p < 0.001 私は混乱しています。値を見ると、2つの変数は非常に近いため、相関していないと言え。ただし、回帰直線の勾配はほぼ(プロットではほぼ水平に見えますが)、p値は回帰が非常に有意であることを示しています。R2R2R^2000111 これは、2つの変数が高度に相関していることを意味していますか?その場合、値は何を示していますか?R2R2R^2 Durbin-Watson統計がソフトウェアでテストされ、帰無仮説(に等しい)を拒否しなかったことを追加する必要があります。これは変数間の独立性をテストしたと思います。この場合、変数は個々の鳥の測定値であるため、変数が依存していると予想されます。私は個人の身体状態を決定する公開された方法の一部としてこの回帰を行っているので、この方法で回帰を使用することは理にかなっていると思いました。しかし、これらのアウトプットを考えると、おそらくこれらの鳥にとって、この方法は適切ではないと考えています。これは合理的な結論に思えますか?1.3571.3571.357222222

2
ロバスト線形モデルの重み付き
MASSパッケージのRを使用してrlm()、MMの重みでロバストな線形モデルを推定しました。`R``はモデルの値を提供しませんが、意味のある量であればR 2が欲しいです。また、ロバスト回帰で観測値に重みが付けられたのと同じ方法で、合計分散と残差を重み付けするR 2値を持つことに意味があるかどうかを知りたいと思っています。私の一般的な考え方は、回帰の目的で、何らかの方法で外れ値であるため、いくつかの推定値の影響が少ない重みを本質的に使用している場合、r 2を計算するためにそれらを与える必要があるかもしれないということです同じ見積もりは影響が少ない?R2R2R^2R2R2R^2r2r2r^2 と重み付きR 2の2つの簡単な関数を書きました。それらは以下にあります。また、HI9と呼ばれる私のモデルに対してこれらの関数を実行した結果も含めました。編集:私は式を与えるUNSWのアデルコスターのウェブページが見つかりそれは両方の計算の計算に重みベクトルを含んでいると、私がやったように、そしてより正式な参照のために彼女に尋ねた:のhttp://web.maths。 unsw.edu.au/~adelle/Garvan/Assays/GoodnessOfFit.html(この重み付けされたr 2の解釈方法については、Cross Validatedからのヘルプを引き続き探しています。)R2R2R^2R2R2R^2R2SSeSStr2r2r^2 #I used this function to calculate a basic r-squared from the robust linear model r2 <- function(x){ + SSe <- sum((x$resid)^2); + observed <- x$resid+x$fitted; + SSt <- sum((observed-mean(observed))^2); + value <- 1-SSe/SSt; + return(value); + } r2(HI9) [1] 0.2061147 #I …

2
のcoxphモデルの要約で与えられた「
のcoxphモデルの要約で与えられるR 2値は何ですか?例えば、R2R2R^2 Rsquare= 0.186 (max possible= 0.991 ) 私は愚かにも原稿を値として含めましたが、レビュアー はCoxモデル用に開発された古典的な線形回帰からのR 2統計の類似体に気づいていないと言いました。参照。どんな助けも素晴らしいでしょう!R2R2R^2R2R2R^2

5
ん持って-squared -値を?
乗値にも値があるかどうかを理解しようとして混乱しているようです。prrrppp 私が理解しているように、データポイントのセットとの線形相関では、はから範囲の値を持つことができ、この値は、それが何であれ、がと著しく異なるかどうかを示す値を持つことができます(つまり、 、2つの変数の間に線形相関がある場合)。− 1 1 p r 0rrr− 1−1-1111ppprrr000 線形回帰に移ると、関数をデータに適合させることができます。これは、方程式で記述されます。と (切片と勾配)にも値があり、それらが大きく異なるかどうかを示し。a b p 0Y= a + b XY=a+bXY = a + bXaaabbbppp000 私は今のところ正しいのすべてを理解していると仮定すると、あるための-値とための-値だけで同じこと?それは値を持つ乗ではなく、またはを持つと言うのは正しいですか?r p b r p r bppprrrpppbbbrrrppprrrbbb

3
回帰におけるR二乗とp値の関係は何ですか?
tl; dr-OLS回帰の場合、Rの2乗が大きいほどP値も高いことを意味しますか?特に単一の説明変数(Y = a + bX + e)についてですが、n個の複数の説明変数(Y = a + b1X + ... bnX + e)についても知りたいと思います。 コンテキスト-変数の範囲でOLS回帰を実行し、線形、対数など、各説明(独立)変数の変換の間のR 2乗値を含むテーブルを作成することにより、最適な説明関数形式を開発しようとしています。および応答(従属)変数。これは少し似ています: 変数名--linear form-- --ln(variable)--exp(variable)-... etc 変数1 ------- R-squared ---- R-squared ---- R-squared-... など... Rの2乗が適切か、またはP値の方が良いかどうか疑問に思っています。より重要な関係はより高い説明力を意味するが、それが厳密な方法で真実であるかどうかはわからないため、おそらく何らかの関係があります。

1
モデルの比較にR 2乗値は適切ですか?
私は、自動車の広告サイトで利用可能な価格と機能を使用して、自動車の価格を予測するための最良のモデルを特定しようとしています。 このために、scikit-learnライブラリーのモデルと、pybrainとneurolabのニューラルネットワークモデルを使用しました。これまでに使用したアプローチは、いくつかのモデル(機械学習アルゴリズム)で一定量のデータを実行し、scikit-learnメトリックモジュールで計算されたR2R2R^2値を比較することです。 あるR2R2R^2異なるモデルの性能を比較するための良い方法は? エラスティックネットやランダムフォレストなどのモデルでは非常に許容できる結果が得られましたが、ニューラルネットワークモデルのR2R2R^2値は非常に低いので、R2R2R^2はニューラルネットワーク(または非線形手法)を評価するための適切な方法ですか?

3
主成分分析の「後方」:データの分散は、変数の与えられた線形結合によってどの程度説明されますか?
6つの変数、、、、、主成分分析を実行しました。正しく理解すれば、回転していないPC1はこれらの変数の線形結合がデータの最大の分散を説明/説明し、PC2はこれらの変数の線形結合がデータの次に大きな分散を説明するなどを教えてくれます。AAABBBCCCDDDEEEFFF 私はちょうど興味があります-この「後方」を行う方法はありますか?これらの変数の線形結合を選択するとしましょう。たとえば、場合、これが記述するデータの分散を計算できますか?A+2B+5CA+2B+5CA+2B+5C

3
負のR 2乗とはどういう意味ですか?
いくつかのデータがあり、そのデータをモデルに適合させたとしましょう(非線形回帰)。次に、Rの2乗(R2R2R^2)を計算します。 R-2が負の場合、それはどういう意味ですか?それは私のモデルが悪いということですか?の範囲はR2R2R^2[-1,1]になります。ときR2R2R^2平均のことだけでなく何をするか、0でありますか?

3
重回帰の予測変数間でr 2乗を分割する方法は?
著者が2つの予測変数を使用して重回帰を実行した論文を読んだばかりです。全体のr 2乗値は0.65でした。彼らは、2つの予測変数の間でr 2乗を分割する表を提供しました。テーブルは次のようになりました。 rsquared beta df pvalue whole model 0.65 NA 2, 9 0.008 predictor 1 0.38 1.01 1, 10 0.002 predictor 2 0.27 0.65 1, 10 0.030 データセットRを使用して実行したこのモデルではmtcars、全体のr 2乗値は0.76です。 summary(lm(mpg ~ drat + wt, mtcars)) Call: lm(formula = mpg ~ drat + wt, data = mtcars) Residuals: Min 1Q …

4
データを変換するときに避けるべき落とし穴?
応答を二重に変換した後、変数XXXとYYY変数の間に強い線形関係を達成しました。モデルとなった Y∼XY∼XY\sim X が、私はそれを変換 YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X} 改善R2R2R^20.76に0.19から。 明らかに、私はこの関係でいくつかのまともな手術をしました。過度の変換の危険性や統計原則の違反の可能性など、これを行うことの落とし穴について誰でも議論できますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.