タグ付けされた質問 「regression-coefficients」

回帰モデルのパラメーター。最も一般的には、従属変数の予測値を取得するために独立変数に乗算される値。

2
最小二乗係数を破棄することによるスパース性
正規化されたに対してを回帰したいとしますが、スパースソリューションが必要です。回帰後、最小の大きさの係数を破棄できないのはなぜですか?YYYXXX 記録のために、私はLARSおよびLASSOメソッドを聞いたことがあり、よく使用します。上記のアプローチが適用できない理由を知りたいだけです。

1
直交多項式回帰から生の係数と分散を回復する
それは私のような回帰モデルを持っている場合と思われるyi〜β0+β1バツ私+β2バツ2私+β3バツ3私y私〜β0+β1バツ私+β2バツ私2+β3バツ私3y_i \sim \beta_0 + \beta_1 x_i+\beta_2 x_i^2 +\beta_3 x_i^3生の多項式を当てはめて信頼性の低い結果を得るか、直交多項式を当てはめて直接的な物理的解釈のない係数を得ることができます(たとえば、元のスケールで極値の位置を見つけるのに使用できません)。私は両方の長所を持ち、フィットした直交係数とその分散を元のスケールに変換できるようになっているようです。私は応用線形回帰の大学院コースを受講し(Kutner、5edを使用)、Draperの多項式回帰の章(3ed、Kutnerによって参照)を調べましたが、これを行う方法についての議論は見つかりませんでした。のヘルプテキストpoly()Rの関数はそうではありません。ここを含め、ウェブ検索で何も見つかりませんでした。直交多項式に当てはめられた係数から生の係数を再構築しています(そしてその分散を取得しています)... 不可能で、時間を無駄にしています。 おそらく可能ですが、一般的な場合の方法はわかりません。 「誰がしたいのか?」 可能ですが、「明らか」だから議論されていません。 答えが3または4の場合、これを行う方法を説明したり、そうするソースを指摘したりする忍耐があれば、非常に感謝します。それが1または2の場合、私はまだ障害が何であるかを知りたいです。これを読んでくれてありがとう、そして明白な何かを見落としているなら、私は前もって謝罪する。

4
「節度」対「相互作用」?
私はこれらの2つの用語に出くわしましたが、これらの用語は多くの文脈で同じ意味で使用されています。 基本的に、モデレーター(M)はXとYの関係に影響を与える要因です。通常、モデレーション分析は回帰モデルを使用して行われます。たとえば、性別(M)は、「製品調査」(X)と「製品購入」(Y)の関係に影響を与える可能性があります。 相互作用では、X1とX2が相互作用してYに影響します。ここで同じ例は、「製品研究」(X1)が「性別」(X2)の影響を受け、一緒に「製品購入」(Y)に影響することです。 節度では、MはXY関係に影響しますが、相互作用では、M(この場合は性別)が他のIVに影響することがわかります。 質問:プロジェクトの目的が性別がXとYの関係にどのように影響するかを確認することである場合、モデレーションまたはインタラクションを使用する必要がありますか? 注:私のプロジェクトは、XとYの因果関係ではなく、XとYの相関関係に関するものです。

2
r、rの2乗、残差標準偏差は線形関係について何を教えてくれますか?
リトル背景 私は、回帰分析の解釈に取り組んでいますが、私は本当にRの意味について混乱、rは乗と残留標準偏差。私は定義を知っています: 特徴づけ rは、散布図上の2つの変数間の線形関係の強度と方向を測定します R-2乗は、データが近似回帰直線にどれだけ近いかを示す統計的尺度です。 残差標準偏差は、線形関数の周囲に形成される点の標準偏差を記述するために使用される統計用語であり、測定される従属変数の精度の推定値です。(ユニットが何であるかわからない、ここのユニットについての情報は役に立つでしょう) (ソース:ここ) 質問 私はキャラクタリゼーションを「理解」していますが、これらの用語がどのようにデータセットについて結論を導き出すかを理解しています。ここに小さな例を挿入します。これは私の質問に答えるためのガイドとして役立つかもしれません(あなた自身の例を自由に使用してください!) 例 これは手間がかかる質問ではありませんが、簡単な例を得るために本で検索しました(私が分析している現在のデータセットは複雑すぎて、ここに表示するには大きすぎます) トウモロコシの大きな畑で、それぞれ10 x 4メートルの20のプロットがランダムに選択されました。各プロットについて、植物密度(プロット内の植物の数)と平均穂軸重量(穂軸あたりの穀物のグラム)が観察されました。次の表に結果を示します。(出典:生命科学の統計) ╔═══════════════╦════════════╦══╗ ║ Platn density ║ Cob weight ║ ║ ╠═══════════════╬════════════╬══╣ ║ 137 ║ 212 ║ ║ ║ 107 ║ 241 ║ ║ ║ 132 ║ 215 ║ ║ ║ 135 ║ 225 ║ ║ ║ 115 …

2
発生率比の解釈
そのため、ランダム効果のネガティブ二項モデルを当てはめたいと思います。そのようなモデルの場合、STATAは指数係数を生成できます。ヘルプファイルによると、このような係数は発生率比として解釈できます。残念ながら、私は英語を母国語としないので、発生率の比率とは何か、またはそれらをどのように翻訳できるかを本当に理解していません。 したがって、私の質問は、発生率比をどのように解釈できるかです。例えば: モデルが1つの変数に対して0.7の発生率比を与えた場合。つまり、依存変数の予想される観測(カウント)の数です。独立変数が1単位変化すると、0.7変化しますか? 誰でも助けることができますか?

3
グループ比較のための交互作用項と個別の回帰のある共同モデル
以前の質問とディスカッションから貴重なフィードバックを収集した後、次の質問を考え出しました。たとえば、男性と女性の2つのグループ間の効果の違いを検出することを目的としているとします。それには2つの方法があります。 2つのグループに対して2つの別々の回帰を実行し、Waldテストを使用して帰無仮説:を拒否します(ただし、は男性の回帰における1つのIV の係数、は同じ係数です)女性の後退におけるIV。b 1 − b 2 = 0 b 1 b 2H0H0H_0b1−b2=0b1−b2=0b_1-b_2=0b1b1b_1b2b2b_2 2つのグループを一緒にプールし、性別ダミーと交互作用項(IV * genderdummy)を含めることにより、共同モデルを実行します。次に、グループ効果の検出は、相互作用の符号と有意性のt検定に基づいて行われます。 ケース(1)でHoが拒否された場合、つまりグループの違いは有意であるが、ケース(2)での交互作用項の係数は統計的に重要ではない、つまりグループの違いが重要でない場合はどうでしょう。または逆の場合、Hoはケース(1)で拒否されず、交互作用項はケース(2)で重要になります。私は何度もこの結果に終わっており、どの結果がより信頼できるのか、そしてこの矛盾の背後にある理由は何なのかと思っていました。 どうもありがとう!

5
非常に多数のデータポイントで値の代入を実行する方法は?
非常に大きなデータセットがあり、約5%のランダムな値が欠落しています。これらの変数は互いに相関しています。次のRデータセットの例は、ダミーの相関データを使用した単なるおもちゃの例です。 set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds <- round ( runif(N, 1, length(xmat)) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
正の相関係数と負の回帰係数記号
リグレッサーと応答(+0,43)の間に正の相関を取得し、その後、このリグレッサーの近似回帰モデルで負の係数を取得することは可能ですか? 私はいくつかのモデルの間でリグレッサーのサインの変化について話していません。係数の符号は常に残ります。 近似モデルの残りの変数は、符号の変更に影響を与える可能性がありますか?

1
LASSO回帰係数の解釈
私は現在、約300の変数と800の観測値を持つデータセットのバイナリ結果の予測モデルの構築に取り組んでいます。このサイトでは、段階的回帰に関連する問題と、なぜそれを使用しないのかについて多くを読みました。 私はLASSOの回帰とその機能選択機能を読んでおり、「キャレット」パッケージと「glmnet」を使用してそれを実装することに成功しています。 私は最適で、モデルの係数を抽出することができるよlambdaとalpha「キャレット」から。ただし、係数の解釈方法には慣れていません。 LASSO係数はロジスティック回帰と同じ方法で解釈されますか? LASSOから選択した機能をロジスティック回帰で使用することは適切でしょうか? 編集 LASSO回帰の指数係数のように、他のすべての係数を一定に保ちながら係数の1単位の対数オッズが変化するときの係数の解釈。 https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-how-do-i-interpret-odds-ratios-in-logistic-regression/

1
異なるデータセット間での同じモデルの回帰係数の比較
同じ冷凍システムで使用された2つの冷媒(ガス)を評価しています。評価用の飽和吸引温度()、凝縮温度()、およびアンペア数()のデータがあります。データには2つのセットがあります。第1冷媒()および第2冷媒()。回帰分析には、線形多変量(S&D)3次多項式モデルを使用しています。2番目の冷媒が消費する電流の平均が、アンペア数(またはパフォーマンスの比較と同様の基準)をパーセンテージでどの程度下回っているのか、またはパーセンテージで示しているのかを確認します。D Y R 1 R 2 S DSSSDDDYYYR1R1R_1R2R2R_2SSSDDD 私の最初の考えは: 使用するモデルを決定:Y= b0+ b1S+ b2D + b3SD + b4S2+ b5D2+ b6S2D + b7D2S+ b8D3+ b9S3Y=b0+b1S+b2D+b3SD+b4S2+b5D2+b6S2D+b7D2S+b8D3+b9S3Y = b_0 + b_1S + b_2D + b_3SD + b_4S^2 + b_5D^2 + b_6S^2D + b_7D^2S + b_8D^3 + b_9S^3 ベースラインデータ(R_1)から係数(b私bib_i)を導き出します。R1R1R_1 これらの係数を使用して、R_2データセット内の各SSS&DDDについて、予想される各アンプドロー(\ hat {Y})を計算してから平均します。R2R2R_2Y^Y^\hat{Y} Y^Y^\hat{Y}平均とR_2データの実際の平均電流(Y2Y2Y_2)を比較します。R2R2R_2 パーセント(%)変化= (Y2− …

1
ログに記録された結果変数の負の線形回帰係数を解釈するにはどうすればよいですか?
従属変数がログに記録され、独立変数が線形である線形回帰モデルがあります。主要な独立変数の勾配係数は負です: .。解釈の仕方がわからない。− .0564−.0564-.0564 絶対値を使用してから、次のように負に変換しますか? (exp(0.0564 )- 1 )⋅ 100 = 5.80(exp⁡(0.0564)−1)⋅100=5.80(\exp(0.0564)-1) \cdot 100 = 5.80 または 次のように負の係数を接続しますか? (exp(- 0.0564 )- 1 )⋅ 100 = - 5.48(exp⁡(−0.0564)−1)⋅100=−5.48(\exp(-0.0564)-1) \cdot 100 = -5.48 つまり、絶対値を使用してからそれを負に変換するのですか、それとも負の係数を接続するのですか?Xの1単位の増加は、Yの__パーセントの減少に関連しているという点で、私の発見をどのように表現しますか?ご覧のとおり、これらの2つの数式は2つの異なる答えを生成します。

2
標準化された係数を非標準化された係数に変換する方法は?
私の目標は、一連の独立変数が与えられた場合の実際の結果を予測するために、主題に関する以前の研究によって導出された係数を使用することです。ただし、研究論文にはベータ係数とt値のみがリストされています。標準化された係数を非標準化された係数に変換することが可能かどうか知りたいのですが。 標準化されていない独立変数を標準化された変数に変換して予測値を計算すると便利ですか?標準化されていない予測値に戻すにはどうすればよいですか(それが可能な場合でも..) 紙のサンプル行を追加: バス路線数(路線)| 0.275(ベータ)| 5.70 ***(t値) 独立変数に関してもこれが与えられます: バス路線数(路線)| 12.56(平均)| 9.02(標準)| 1(分)| 53(最大)


3
-on-
でa = 1.6およびb = 0.4の回帰モデルがあり、相関係数はr = 0.60302です。Y= a + b XY=a+bXY = a + bXa = 1.6a=1.6a = 1.6b = 0.4b=0.4b=0.4r = 0.60302r=0.60302r = 0.60302 場合及びYはその後の周りに切り替えられると方程式となるX = C + D Y C = 0.4545及びD = 0.9091、それはまた持っているのRの値0.60302を。バツXXYYYバツ= c + dYX=c+dYX = c + dYc = 0.4545c=0.4545c=0.4545d= 0.9091d=0.9091d=0.9091rrr0.603020.603020.60302 も0.60302である理由を誰かが説明できることを願っています。(d× b )0.5(d×b)0.5(d\times b)^{0.5}0.603020.603020.60302

1
R / mgcv:なぜte()とti()テンソル積が異なる表面を生成するのですか?
のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています(非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか)。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)(わずかに)異なる結果を生成するのかということです。 MWE(から適応?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.