タグ付けされた質問 「multiple-regression」

2つ以上の非定数の独立変数を含む回帰。

3
分位点回帰に対する線形回帰の利点は何ですか?
線形回帰モデルがあること仮定の束になりクォンタイル回帰は、線形回帰の仮定が満たされた場合、ないとし、その後、私の直感(およびいくつかの非常に限られた経験が)中央値回帰は、線形回帰とほぼ同じ結果を与えるだろうということです。 それでは、線形回帰にはどのような利点がありますか?それは確かにより馴染みがありますが、それ以外は?

5
回帰モデルを改善するために平均絶対誤差の箱ひげ図に基づいて外れ値を削除するのはごまかしですか
下の箱ひげ図に示すように、4つの方法でテストされた予測モデルがあります。モデルが予測する属性の範囲は0〜8です。 すべてのメソッドで、1つの上限外れ値と3つの下限外れ値が示されていることに気付くかもしれません。これらのインスタンスをデータから削除することが適切かどうか疑問に思いますか?または、これは予測モデルを改善するための一種の不正行為ですか?

1
1つの変数が他の変数の線形結合であるにもかかわらず、完全な多重共線性のためにこの回帰が失敗しないのはなぜですか?
今日、私は小さなデータセットで遊んでいて、完全な多重共線性のために失敗すると予想される簡単なOLS回帰を実行しました。しかし、そうではありませんでした。これは、多重共線性に関する私の理解が間違っていることを意味します。 私の質問は:どこが間違っているのですか? 私の変数の1つが他の変数の線形結合であることを示すことができると思います。これにより、フルランクを持たないリグレッサマトリックスが生成されるため、係数を特定しないでください。 私は小さな再現可能なデータセットを生成しました(以下のコード): exporter importer flow dist intraUS 1 Canada Canada 996.8677 6.367287 0 2 Florida Canada 995.8219 9.190562 0 3 Texas Canada 1001.6475 4.359063 0 4 Mexico Canada 1002.4371 7.476649 0 5 Canada Florida 1002.8789 5.389223 0 6 Florida Florida 1007.5589 6.779686 1 7 Texas Florida 996.8938 1.570600 …

1
分散を説明することはどういう意味ですか?
特に、なぜこの概念Multiple R(重回帰で観測されたスコアと予測されたスコアの相関関係として理解できる)があり、それから単なる正方形またはRである別の概念R-squaredがあるのか​​疑問に思っています。 Rの2乗は説明された変動の割合であり、Rはそうではないことを知らされましたが、相関と説明された変動との違いが理解できません。

3
二次項または相互作用項のいずれかが単独では重要ですが、どちらも一緒ではありません
割り当ての一環として、2つの予測変数を使用してモデルを適合させる必要がありました。次に、含まれている予測子の1つに対してモデルの残差のプロットを描画し、それに基づいて変更を行う必要がありました。プロットは曲線の傾向を示したため、その予測子の2次項を含めました。新しいモデルは、二次項が重要であることを示しました。これまでのところすべて良い。 しかし、データは相互作用も理にかなっていることを示唆しています。元のモデルに相互作用項を追加すると、曲線トレンドが「固定」され、モデルに追加されたときにも重要になりました(2次項なし)。問題は、二次項と相互作用項の両方がモデルに追加されるとき、それらの一方は重要ではないということです。 モデルに含める用語(2次または相互作用)とその理由

1
Rのrlm()回帰係数の推定値がlm()と異なるのはなぜですか?
R MASSパッケージのrlmを使用して、多変量線形モデルを回帰しています。多くのサンプルでうまく機能しますが、特定のモデルの準ヌル係数を取得しています: Call: rlm(formula = Y ~ X1 + X2 + X3 + X4, data = mymodel, maxit = 50, na.action = na.omit) Residuals: Min 1Q Median 3Q Max -7.981e+01 -6.022e-03 -1.696e-04 8.458e-03 7.706e+01 Coefficients: Value Std. Error t value (Intercept) 0.0002 0.0001 1.8418 X1 0.0004 0.0000 13.4478 X2 -0.0004 …

2
VIF、条件インデックスおよび固有値
現在、データセットの多重共線性を評価しています。 問題を示唆するVIFのしきい値と条件インデックスはどのくらいですか? VIF: 私はVIFと聞いてい問題です。≥10≥10\geq 10 2つの問題の変数を除去した後、VIFがある各変数について。変数はさらに処理する必要がありますか、またはこのVIFは正常に見えますか?≤3.96≤3.96\leq 3.96 条件インデックス: 30以上の条件インデックス(CI)が問題であると聞きました。私の最高CIは16.66です。これは問題ですか? その他の問題: 他に考慮すべきことはありますか? 他に覚えておく必要があることはありますか?

2
仮説検定の多重線形回帰
複数の線形回帰を使用してさまざまな変数のモデルを作成することに精通しています。ただし、回帰テストを使用して、基本的な仮説のテストを行う場合は興味がありました。もしそうなら、それらのシナリオ/仮説はどのように見えるでしょうか?


1
回帰係数と偏回帰係数の違いは何ですか?
私はAbdi(2003)でそれを読みました 独立変数がペアワイズ直交である場合、回帰における各変数の効果は、この独立変数と従属変数間の回帰の勾配を計算することにより評価されます。この場合(つまり、IVの直交性)、偏回帰係数は回帰係数と等しくなります。他のすべての場合、回帰係数は偏回帰係数とは異なります。 ただし、このドキュメントでは、これらの2種類の回帰係数の違いを説明していませんでした。 Abdi、H.(2003)。偏回帰係数。Lewis-Beck M.、Bryman、A.、Futing T.(編)(2003)Encyclopedia of Social Sciences:Research Methods。カリフォルニア州サウザンドオークス:SAGE Publications。

1
多重線形モデルからの関係を視覚的に提示する最良の方法
約6つの予測変数を含む線形モデルがあり、推定値、F値、p値などを表示します。しかし、単一の予測変数の個々の効果を表すのに最適な視覚的プロットは何かと思いまして応答変数?散布図?条件付きプロット?効果プロット?等?そのプロットをどのように解釈しますか? Rでこれを行うので、可能であれば例を自由に提供してください。 編集:私は主に、特定の予測変数と応答変数との関係を提示することに関心があります。

3
推定
私は次のような理論経済モデルを持っています y=a+b1x1+b2x2+b3x3+uy=a+b1x1+b2x2+b3x3+u y = a + b_1x_1 + b_2x_2 + b_3x_3 + u したがって、理論では、を推定するために、、および因子があると言われています。x1x1x_1x2x2x_2x3x3x_3yyy これで実際のデータが得られたので、、、を推定する必要があります。問題は、実際のデータセットにはとデータのみが含まれていることです。のデータはありません。したがって、実際に適合できるモデルは次のとおりです。b1b1b_1b2b2b_2b3b3b_3x1x1x_1x2x2x_2x3x3x_3 y=a+b1x1+b2x2+uy=a+b1x1+b2x2+uy = a + b_1x_1 + b_2x_2 + u このモデルを推定しても大丈夫ですか? それを推定するものを失いますか? 、推定した場合、項はどこに行くのでしょうか?b1b1b_1b2b2b_2b3x3b3x3b_3x_3 エラー用語で説明されていますか?uuu そして、はおよびと相関していないと仮定したいと思います。x3x3x_3x1x1x_1x2x2x_2

1
母集団のR平方の公平な推定とは何ですか?
多重線形回帰で不偏推定値を取得することに興味がありますR2R2R^2。 熟考すると、不偏推定値が一致しようとしている2つの異なる値を考えることができます。R2R2R^2 Out of sample:R2R2R^2サンプルから得られた回帰方程式(つまり)が、サンプルの外部にある同じデータからの無限量のデータに適用された場合に得られるr平方生成プロセス。β^β^\hat{\beta} 母集団:R2R2R^2無限サンプルが取得され、モデルがその無限サンプル(つまり、)に適合した場合に取得されるr平方、または既知のデータ生成プロセスによって暗示されるR平方のみ。ββ\beta 調整されたR2R2R^2は、サンプル観察された過剰適合を補償するように設計されていることを理解しています。それにもかかわらず、調整後かどうかは明らかではない実際の不偏推定値であり、、それは二定義は上記の不偏推定値である場合、が推定することを目指しています。R2R2R^2R2R2R^2R2R2R^2R2R2R^2 したがって、私の質問: 上記のサンプルからの偏りのない推定値は何ですか?R2R2R^2 母集団より上で私が呼ぶものの公平な推定とは何ですか?R2R2R^2 公平性のシミュレーションまたはその他の証拠を提供する参考文献はありますか?

3
ベイジアン変数選択—本当に機能しますか?
素敵なブログ投稿とそこにリンクされている論文に従って、私はベイジアン変数の選択をいじるかもしれないと思った。私はrjagsでプログラムを作成し(私は非常に新人です)、Exxon Mobilの価格データを、そのリターンを説明する可能性が低いもの(パラジウム価格など)およびその他の関連性の高いもの(SP500など)とともに取得しました)。 実行するlm()と、過剰パラメーター化モデルの強力な証拠がありますが、パラジウムは間違いなく除外する必要があります。 Call: lm(formula = Exxon ~ 0 + SP + Palladium + Russell + OilETF + EnergyStks, data = chkr) Residuals: Min 1Q Median 3Q Max -1.663e-03 -4.419e-04 3.099e-05 3.991e-04 1.677e-03 Coefficients: Estimate Std. Error t value Pr(>|t|) SP 0.51913 0.19772 2.626 0.010588 * Palladium 0.01620 0.03744 0.433 …

4
単純なフォームとはどういう意味ですか?
計量経済学では、縮約形とはどういう意味ですか?また、「フォームの見積もりを減らしたい」と言ったときに、何を探しているのでしょうか。これは職場で放り出されており、個々の説明とGoogle検索は非常に専門的です。簡単な例を挙げることができる誰かを期待しています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.