タグ付けされた質問 「interaction」

説明変数の効果が別の説明変数の値に依存する状況。

1
コックス比例ハザードモデルと、より大きなケースの相互作用が含まれる場合の係数の解釈
以下は、私が使用したCoxphモデルの要約出力です(Rを使用し、出力は最良の最終モデルに基づいています。つまり、すべての重要な説明変数とそれらの相互作用が含まれています)。 coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1) n = 555 coef exp(coef) se(coef) z Pr(>|z|) LT 9.302e+02 Inf 2.822e+02 3.297 0.000979 *** Food 3.397e+03 Inf 1.023e+03 3.321 0.000896 *** Temp2 5.016e+03 Inf 1.522e+03 3.296 0.000979 *** LT:Food …

2
回帰係数がグループ化変数によってモデレートされるかどうかをテストする方法は?
緩和変数(たとえば性別)に基づいて、サンプルの2つのグループで回帰を実行しました。あるセットで回帰の重要性が失われ、他のセットでは失われるかどうかを確認することで、モデレート効果の簡単なテストを行っています。 Q1:上記の方法は有効です。 Q2:私の研究の信頼度は95%に設定されています。1つのグループでは、回帰は.000で有意です。もう1つは0.038で有意なので、両方の回帰を有意として受け入れなければならず、緩和効果はないと私は信じています。回帰を受け入れることは重要ですが、0.01 amではないことが証明されていますが、タイプIエラーを引き起こしています(偽の引数を受け入れます)?

2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
ランダムフォレストモデルに交互作用項を含める方法
randomForestRのrandomForestパッケージの関数を使用して回帰を行っています。ただし、次のコードに相互作用用語を含めようとすると、 library(MASS) library(randomForest) Boston_f <- within(Boston, factor(rad)) mdl <- randomForest(lstat ~ rad * . , data = Boston_f) 結果にmdl$termは相互作用が含まれますが、mdl使用しているツリーをのぞくと、 getTree(mdl, 1, T) 相互作用項を使用して分割変数を見つけることができません。 誰かが相互作用の用語を使用しrandomForestたり、他の関数を含める方法を知っていますか?

2
scikit-learnでカテゴリ変数の相互作用を準備する方法は?
scikit-learnでフィッティングする前に、カテゴリ特徴の相互作用を準備する最良の方法は何ですか? とstatsmodels私はRスタイルで便利に言うことができましたsmf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()(とスタタで同じですregress depvar i.var1##i.var2)。 sklearn.preprocessing.PolynomialFeatures(v0.15では、現在開発中)カテゴリ変数を使用できますか?

2
GAMの連続予測子とカテゴリー予測子の間の相互作用をモデリングするさまざまな方法
次の質問は、このページでの議論に基づいています。応答変数y、連続説明変数x、および因子facを指定するxとfac、引数間の相互作用を使用して、一般的な加法モデル(GAM)を定義できますby=。Rパッケージのヘルプファイル ?gam.modelsによるとmgcv、これは次のように実行できます。 gam1 <- gam(y ~ fac +s(x, by = fac), ...) ここで@GavinSimpsonは別のアプローチを提案しています。 gam2 <- gam(y ~ fac +s(x) +s(x, by = fac, m=1), ...) 私は3番目のモデルで遊んでいます: gam3 <- gam(y ~ s(x, by = fac), ...) 私の主な質問は次のとおりです。これらのモデルのいくつかは間違っているのですか、それとも単に異なるのですか?後者の場合、それらの違いは何ですか? 以下で説明する例に基づいて、それらの違いのいくつかは理解できたと思いますが、それでも何か不足しています。 例として、異なる場所で測定された2つの異なる植物種の花の色スペクトルを持つデータセットを使用します。 rm(list=ls()) # install.packages("RCurl") library(RCurl) # allows accessing data from URL df <- …
8 r  interaction  gam  mgcv 

1
重回帰で、相互作用が予測子の積としてモデル化され、他のものではないのはなぜですか?
多重線形回帰を検討してください。この質問は一見単純そうですが、なぜ予測子X1とX2がある場合、これらの予測子間の相互作用はX1 * X2によって適切に捕捉できるのかを直感的に理解しようとしています。 インタラクションの用語が製品としてモデル化されていることを知っています。それは、それが私が学校で教えられたこと、そしてそれが誰もがそうするように言われていることだからです。私はおそらくいくつかの幾何学的な議論があると思います。 しかし、なぜ積(たとえば、2つの数値特徴であり、一方がダミー変数であり、もう一方が数値であるなどの乗算による追加の複雑さではない)が相互作用を適切にキャプチャするのですか? 「相互作用」がデフォルトで具体的にX1 * X2ではなくデフォルトで別のf(X1、X2)によって最もよくキャプチャされないのはなぜですか? X1 * X2はX1とX2の符号が同じであるか、またはそうでない状況をキャプチャする可能性があるという考えを見ることができますが、なぜデフォルトでは、相互作用は、たとえばf(X1、X2)= sign(X1 )* f(X1、X2)= X1X2の代わりにsign(X2)? 他の任意のf(X1、X2)を回帰または任意の予測モデルに追加できることを認識していますが、手動コーディングによって相互作用の正確な形状を見つけるのは時間がかかります。X1X2が良い最初の推測であることをどうやって知るのですか?

1
相互作用の変数間の相関関係は重要ですか?
モデルを近似するとします。とが相関している場合、相互作用効果の推定に実際的な影響はありますか?y=x1+x2+x1×x2y=バツ1+バツ2+バツ1×バツ2y = x_1 + x_2 + x_1\times x_2x1バツ1x_1x2バツ2x_2 とが非常に相関している場合、共線性の問題が発生する可能性があることを理解していますが、それは相互作用項に影響を与えるべきではありませんか?x1x1x_1x2x2x_2

1
統計的相互作用は重要ですが、著者はそれを否定しています。どうして?
統計的相互作用に関するジャーナル記事を評価しています。 記事は、血圧の厳しくない制御と重度の高血圧への進行との関係を確立しようとしています。それは、既存の高血圧が予後因子であると疑っています()。p=0.048&lt;0.05p=0.048&lt;0.05p=0.048<0.05 その防御はそれです -値はわずかに有意です。これは偶然かもしれません。既存の高血圧が本当に予後不良因子である場合、低血糖の率は、妊娠性高血圧のないものと比較して、緊密性の低い対照群と緊密な対照群でより高かったはずです。ppp この抗弁は本当に有効ですか?この議論は、「既存の高血圧」を重度の高血圧への進行の危険因子として反駁するように聞こえます。 以下はデータです。 Pre-existing hypertensionGestational hypertensionOR=2.11OR=1.13p=0.048Pre-existing hypertensionOR=2.11Gestational hypertensionOR=1.13p=0.048\begin{array} {|c|c|} \hline \text{Pre-existing hypertension} & OR=2.11 \\ \hline \text{Gestational hypertension} & OR=1.13 \\ \hline & p=0.048 \\ \hline \end{array} Pre-existing hypertensionLess-tight controlTight controlProgression15996No progression210267Pre-existing hypertensionProgressionNo progressionLess-tight control159210Tight control96267\begin{array} {|c|c|c|} \hline \text{Pre-existing hypertension} & \text{Progression} & \text{No progression} \\ \hline …

1
lmerで2方向および3方向の相互作用を解釈する方法は?
lmerで2方向および3方向の相互作用を解釈することに問題があります。私のDVは、連続変数である高さです。すべてのIVはカテゴリ変数です。最初の要素は、ラットまたはライオンの動物です。2番目の要素は、男性または女性の性別です。3番目の要素は色です:赤、白、または黄色。出力の解釈に戸惑います: Fixed effects: Estimate Std. Error t value (Intercept) 164.6888 7.8180 21.065 rat -14.1342 8.2889 -1.705 sexmale -16.0883 10.0071 -1.608 colorred 0.5776 6.2473 0.092 coloryellow -14.4048 6.1025 -2.360 rat:sexmale 15.3645 11.8567 1.296 rat:colorred 12.5258 4.4028 2.845 rat:coloryellow 10.3136 4.3196 2.388 sexmale:colorred 2.0272 5.2773 0.384 sexmale:coloryellow 5.7643 5.1669 1.116 rat:sexmale:colorred -5.5144 …

1
すべての対数線形モデルには、完全に同等のロジスティック回帰がありますか?
対数線形モデルを調査データの多数の変数に適合させようとしています。代わりにロジスティック回帰をそのデータに当てはめることが望ましい場合があるいくつかの理由があります。いくつかの当局は、これらは同等であると示唆しています。しかし、私はこれを疑ういくつかの理由があります。 対数線形モデルはすべての変数を同等に扱いますが、ロジスティック回帰では1つの変数を応答変数として識別する必要があります。 最小二乗のコンテキストでは、Y = a + bX +ε対X = c + dY +εの場合、パラメーターdが約1 / bに等しいことは一般的ではありません。これは、最初の方程式が垂直誤差を最小限に抑え、2番目の方程式が水平誤差を最小限に抑えるためです。これらは、推定された線の周りで誤差が対称である場合にのみ等しくなります。そのため、これがロジスティック回帰にも当てはまるのではないかと心配しています。(2)は、実際には(1)の特定の形式にすぎません。つまり、特定の変数を応答として選択することにより、回帰形式で非対称になる可能性があります。 対数線形モデルのすべての変数が1つ以上の交互作用項に含まれている場合、ロジスティック回帰がどのように等価になるかはわかりません。応答変数がロジスティック回帰のコンテキストに含まれる相互作用をどのように表現しますか? Bill Huberに応えて、私はWikipediaよりもかなり制限された意味で対数線形モデルという用語を使用しています。テーブルに配置されたカテゴリーまたは順序カウントデータのモデルを参照します。係数はテーブルカウントの合計、各因子のマージナルカウントをテーブルカウントの合計(確率のプロキシとして機能)で割った値、およびさまざまな交互作用項です。これは、とりわけ、Agrestiで使用されている「カテゴリデータ分析」の意味です。

3
SPSSを使用した2x3混合設計ANOVAの事後テスト?
実験中に3回評価された10人の参加者の2つのグループがあります。グループ間および3つの評価全体の違いをテストするために、group(コントロール、実験)、time(最初、2、3)、およびを使用して2x3混合設計ANOVAを実行しましたgroup x time。両方timeとgroup有意な相互作用があったほか、重大な結果group x time。 グループメンバーシップに関しても、3回の評価の違いをさらにチェックする方法をよく知りません。実際、最初は、ANOVAのオプションで、ボンフェローニの補正を使用してすべての主要な効果を比較することだけを指定しました。しかし、この方法で、グループを区別せずに、サンプル全体の時間の違いをこのように比較したことに気付きましたね。 したがって、可能な解決策を見つけるためにインターネットでたくさん検索しましたが、結果はほとんどありませんでした。私と同じようなケースは2つしか見つかりませんでしたが、解決策は逆です! 記事では、混合設計の後、著者らは被験者ごとに1つずつ、2回の反復測定ANOVAを事後的に実行しました。このようにして、2つのグループは修正なしで個別に分析されます。 インターネットのガイドでは、混合ANOVAの実行中に、SPSS構文のCOMPARE(time) ADJ(BONFERRONI)直後にを手動で追加すると述べています/EMMEANS=TABLES(newgroup*time)。このように、3つの時間はグループごとに個別に比較されます。ボンフェローニ補正を使用すると、私は正しいのでしょうか。 どう思いますか?どちらが正しい方法でしょうか?
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 

3
混合効果モデルで因子と共変量の間の相互作用を調べる方法は?
私は2つの因子AとB(5×3)と1つの共変量Xをサブジェクト内の設計に持っています。全体的なモデルを指定する方法は次のとおりです。 lme.out = lme(y~ A*B*X, random=~1|Subject, data=mydata) 私の解釈は、私がグラフで探していますということであるy~x傾きが異なるのレベルに基づいて共変量による変化、およびラインシフトアップまたはダウン、A及びB(インターセプトの変化)。 私が知りたいのは、因子を修正するA(レベルのいずれかをとる)場合、線(y~x)を見ると、どのような影響がありBますか?のレベルはBラインを上下にシフトしますか(切片)、またはラインの傾きを変更しますか(X)。 何らかのコントラスト分析を実行する必要がありますか?しかし、因子と共変量の間でコントラストがどのように機能するかはわかりません。 私が考えることができる1つの方法は、Aのさまざまなレベルに対応するデータのサブセットを取得し、次のようなモデルを作成することですlme(y~ B+X, random=~1|Subject, data=mydata[which(mydata$A = A1,])。このようにして、これらのモデル全体で得られる切片と勾配を比較できます。 私がしていることが理にかなっている場合、誰かが教えてもらえますか?どんな提案でも大歓迎です!

2
高次の相互作用が重要な場合に低次の相互作用を解釈するにはどうすればよいですか?
有意な高次相互作用効果が存在する場合の低次相互作用項の解釈について質問があります。 2(因子)× 2(因子B)× 2(因子C)の設計があり、最高次数の相互作用(A × B × C)が重要であり、低次の相互作用項(A × B)も重要であるとします。 。重要なA × B × Cの相互作用は、A × Bの相互作用を解釈不能にしますか(重要な相互作用が存在する場合に主効果が解釈不能になるのと同様に)?あAA××\timesBBB××\timesCCCA × B ×CA×B×CA\times B\times CA × BA×BA\times BA × B × CA×B×CA\times B\times CA×BA×BA\times B このような状況では、一連の事後比較/計画比較を実行して、さまざまな条件がどのように異なるかを確認する必要がありますか?

2
コックス比例ハザードモデルの相互作用項をどのように解釈すればよいですか?
Cox比例ハザードモデルの出力で、2つの連続予測子の次の相互作用項をどのように解釈すればよいですか? XとYの相互作用のハザード比は&gt; 1です。これは、そのログ(元の係数)が0〜1(〜0.16)であることを意味します。個々のアイテムのHRは1未満で、係数はX = -0.18およびY = -0.11です。 | Variable | HR (s.e.) | p value ----------------------------------------------------------- 1 A (5 points) |0.756 (0.088) | 0.001 | 2 B (5 points) |1.379 (0.11) | 0.001 | 3 X (10 points) |0.837 (0.033) | 0.0011| 4 Y (1 point) |0.895 (0.03) | 0.001| …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.