タグ付けされた質問 「regression」

1つ(または複数)の「従属」変数と「独立」変数の間の関係を分析する手法。


5
ランダムフォレストと回帰
5つの独立変数を持つデータセットでOLS回帰モデルを実行しました。独立変数と従属変数は両方とも連続的であり、線形に関連しています。Rスクエアは約99.3%です。しかし、Rでランダムフォレストを使用して同じことを実行すると、結果は「%Var説明:88.42」になります。なぜランダムフォレストの結果は、回帰に比べてそれほど劣るのでしょうか?私の仮定では、ランダムフォレストは少なくともOLS回帰と同じくらい良いだろうということでした。

4
回帰分析と分散分析の違いは?
この質問は、相互検証で回答できるため、Mathematics Stack Exchangeから移行されました。 7年前に移行され ました。 現在、回帰分析と分散分析について学んでいます。 回帰分析では、1つの変数が固定されており、変数が他の変数とどのように関係するかを知りたいと考えています。 たとえば、分散分析では、この特定の動物向け食品が動物の体重に影響を与える場合... 1つの固定変数と他の動物への影響について... それは正しいか間違っていますか、plsは私を助けます...
21 regression 

4
重回帰における予測変数の重要性:部分対標準化係数
部分モデルと線形モデルの係数との正確な関係と、因子の重要性と影響を説明するためにどちらか一方のみを使用すべきかどうか疑問に思っています。R2R2R^2 私が知る限りsummary、係数の推定値を取得しanova、各因子の平方和を取得します-1つの因子の平方和を平方和と残差の合計で割った割合は部分(次のコードはにあります)。R2R2R^2R library(car) mod<-lm(education~income+young+urban,data=Anscombe) summary(mod) Call: lm(formula = education ~ income + young + urban, data = Anscombe) Residuals: Min 1Q Median 3Q Max -60.240 -15.738 -1.156 15.883 51.380 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.868e+02 6.492e+01 -4.418 5.82e-05 *** income 8.065e-02 9.299e-03 8.674 2.56e-11 *** young 8.173e-01 …

3
回帰とANOVAの不一致(Rのaovとlm)
私は常に回帰はANOVAのより一般的な形式であり、結果は同一であるという印象を受けていました。しかし、最近、同じデータに対して回帰と分散分析の両方を実行しましたが、結果は大きく異なります。つまり、回帰モデルでは主効果と交互作用の両方が重要ですが、ANOVAでは主効果の1つは重要ではありません。これはインタラクションと関係があると思いますが、同じ質問をモデル化するこれら2つの方法の違いは明確ではありません。以下のシミュレーションに示すように、重要な場合、一方の予測子はカテゴリカルであり、他方の予測子は連続的です。 以下は、私のデータがどのように見えるか、実行している分析の例ですが、結果に同じp値または影響がありません(実際の結果の概要は上記のとおりです)。 group<-c(1,1,1,0,0,0) moderator<-c(1,2,3,4,5,6) score<-c(6,3,8,5,7,4) summary(lm(score~group*moderator)) summary(aov(score~group*moderator))
21 r  regression  anova 


3
ポアソン回帰対ログカウント最小二乗回帰?
ポアソン回帰は、ログリンク機能を備えたGLMです。 非正規分布のカウントデータをモデル化する別の方法は、ログ(または、log(1 + count)を処理して0を処理する)を使用して前処理することです。対数応答で最小二乗回帰を行う場合、ポアソン回帰に関連していますか?同様の現象を処理できますか?

2
Rの関数lmで重みを使用する方法は?
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 誰かweightsがRのlm関数で引数を使用する方法についていくつかのポインタを提供できますか?たとえば、交通量データにモデルを適合させようとしていて、数百の行があり、各行が(異なる人口を持つ)都市を表しているとします。モデルが母集団のサイズに基づいて各観測の相対的な影響を調整するようにしたい場合、単に指定できますweights=[the column containing the city's population]か?それが入るようなベクトルweightsですか?または、別のR関数/パッケージ/アプローチを完全に使用する必要がありますか? 人々がこの問題にどのように取り組んでいるか聞いて興味があります-私がそこで見たどの線形モデリングのチュートリアルでもそれがカバーされているのを見ませんでした。ありがとう!
21 r  regression 

2
回帰における直線性のテストの難しさ
で統計モデリング:二つの文化レオ・ブレイマンは書いて 現在適用されている方法は、適合度テストと残差分析を使用してデータモデルの適合をチェックすることです。ある時点で、数年前、私は制御された量の非線形性を持つ7つの次元で回帰問題をシミュレートしました。適合度の標準テストでは、非線形性が極端になるまで線形性を拒否しませんでした。 ブライマンは、シミュレーションの詳細を提供していません。彼は、彼の観察を理論的に正当化する論文を引用していますが、論文は未発表です。 ブリーマンの主張を裏付ける公開されたシミュレーション結果や理論論文を見た人はいますか?

3
決定係数(
r 2の概念を完全に把握したいr2r2r^2変数間の変動量を表すます。すべてのウェブの説明は少し機械的で鈍いです。単に機械的に数字を使用するのではなく、コンセプトを「取得」したい。 例:学習時間とテストスコア rrr = .8 r2r2r^2 = .64 それで、これはどういう意味ですか? テストスコアの変動の64%は時間単位で説明できますか? どうすれば二乗するだけでそれを知ることができますか?

5
正弦波の予測でニューラルネットワークを改善するにはどうすればよいですか?
ここでは、見て: あなたは場所を正確にトレーニングデータの終了を確認することができます。トレーニングデータから行くまで1。−1−1-1111 Kerasと、tanhアクティベーションを使用した1-100-100-2の高密度ネットワークを使用しました。pとqの2つの値pとqから結果を計算します。このように、1より小さい値のみを使用して、任意のサイズの数値を実現できます。 私はまだこの分野の初心者であるため、簡単に説明してください。

2
リッジ回帰の仮定とそれらをテストする方法は何ですか?
多重回帰のための標準的なモデル検討、全ての保留正常、等分散性及びエラーのuncorrelatednessので。ε 〜N(0 、σ 2 I N)Y= Xβ+ εY=Xβ+εY=X\beta+\varepsilonε 〜N(0 、σ2私n)ε∼N(0,σ2In)\varepsilon \sim \mathcal N(0, \sigma^2I_n) の対角のすべての要素に同じ少量を追加することにより、リッジ回帰を実行するとします。バツXX βr i d g e= [ X′バツ+ k I]− 1バツ′Yβridge=[X′X+kI]−1X′Y\beta_\mathrm{ridge}=[X'X+kI]^{-1}X'Y はバイアス推定器ですが、リッジ係数の平均二乗誤差がOLSによって得られる値よりも小さい値がいくつかあります。実際には、は相互検証によって取得されます。β R I D G E β Kkkkβr i d g eβridge\beta_\mathrm{ridge}ββ\betakkk ここに私の質問があります:リッジモデルの基礎となる仮定は何ですか?具体的には、 リッジ回帰では、通常の最小二乗(OLS)の仮定はすべて有効ですか? 質問1が「はい」の場合、偏った推定量して、等分散性と自己相関の欠如をどのようにテストしますか?ββ\beta リッジ回帰の下で他のOLS仮定(同相性と自己相関の欠如)をテストする作業はありますか?

2
単純な線形回帰では、残差の分散の式はどこから来ますか?
私が使用しているテキストによると、残差の分散の式は次のようになります。ithithi^{th} σ2(1−1n−(xi−x¯¯¯)2Sxx)σ2(1−1n−(xi−x¯)2Sxx)\sigma^2\left ( 1-\frac{1}{n}-\frac{(x_{i}-\overline{x})^2}{S_{xx}} \right ) 残差は観測値と適合値の差であるため、これは信じがたいことです。差の分散を計算する場合、少なくとも、結果の式にいくつかの「プラス」が期待されます。派生を理解する上で助けていただければ幸いです。ithithi^{th}ithithi^{th}ithithi^{th}

2
多重線形回帰モデルを記述または視覚化する方法
いくつかの入力パラメーター、たとえば3を使用して、多重線形回帰モデルをデータに適合させようとしています。 F(x )F(x )= A x1+ B x2+ Cバツ3+ dまたは= (A B C )T(x1 バツ2 バツ3)+ d(私)(ii)(私)F(バツ)=Aバツ1+Bバツ2+Cバツ3+dまたは(ii)F(バツ)=(A B C)T(バツ1 バツ2 バツ3)+d\begin{align} F(x) &= Ax_1 + Bx_2 + Cx_3 + d \tag{i} \\ &\text{or} \\ F(x) &= (A\ B\ C)^T (x_1\ x_2\ x_3) + d \tag{ii} \end{align} このモデルを説明して視覚化するにはどうすればよいですか?次のオプションが考えられます。 このモデルの精度を示すために、標準偏差と(係数、定数)で説明されているように回帰方程式に言及し、次に残差プロットに言及します。 (i )(私)(i) …

1
ブートストラップを使用して回帰の係数の信頼区間を推定する2つの方法
私は自分のデータに線形モデルを適用しています: yi=β0+β1xi+ϵi,ϵi∼N(0,σ2).yi=β0+β1xi+ϵi,ϵi∼N(0,σ2). y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). Iは、係数の信頼区間(CI)(推定したいβ0β0\beta_{0}、β1β1\beta_{1}、ブートストラップ法を使用します)。ブートストラップ方式を適用できる方法は2つあります。 ペアの応答予測子のサンプル:ペアをランダムにリサンプリングし、各実行に線形回帰を適用します。後は、m個の実行、我々は、推定された係数の集合得る^ β J、J = 1 、。。。メートル。最後に、の分位数を計算^ β jは。yi−xiyi−xiy_{i}-x_{i}mmmβj^,j=1,...mβj^,j=1,...m{\hat{\beta_{j}}}, j=1,...mβj^βj^{\hat{\beta_{j}}} サンプルエラー:まず、我々は入手このモデルから、元の観測データに線形回帰を適用とエラーε I。その後、ランダムエラーリサンプリングεを* Iとを使用して新しいデータを計算^ β O及び yは* I = ^ β O X I + ε * I。もう一度線形回帰を適用します。後は、m個の実行、我々は推定coefficeintsのコレクションを取得^ βのJ、J = 1 、βo^βo^\hat{\beta_{o}}ϵiϵi\epsilon_{i}ϵ∗iϵi∗\epsilon^{*}_{i}βo^βo^\hat{\beta_{o}}y∗i=βo^xi+ϵ∗iyi∗=βo^xi+ϵi∗y^{*}_{i}=\hat{\beta_{o}}x_{i}+\epsilon^{*}_{i}mmm。最後に、の分位数を計算 ^ β jは。βj^,j=1,...,mβj^,j=1,...,m{\hat{\beta_{j}}}, j=1,...,mβj^βj^{\hat{\beta_{j}}} 私の質問は: これら2つの方法はどのように違いますか? これらの2つの方法は、どの仮定の下で同じ結果をもたらしますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.