タグ付けされた質問 「interaction」

説明変数の効果が別の説明変数の値に依存する状況。


2
有向非循環グラフでの相互作用効果の表現
有向非循環グラフ(DAG;たとえば、Greenland、et al、1999)は、因果関係キャンプの反事実的解釈からの因果推論の形式化の一部です。これらのグラフでは、変数からの矢印の存在ああA 変数に BBB その変数を主張する ああA 直接的に(リスクの変化が)変動する BBB、そしてそのような矢印がないことはその変数を主張します ああA 直接的に(リスクの一部の変化)変動を引き起こさない BBB。 例として、「タバコの煙に直接曝露すると中皮腫のリスクが変化する」という記述は、下のDAG因果図ではなく、「タバコの煙に曝露」から「中皮腫」への黒い矢印で表されます。 同様に、「アスベストへの曝露により中皮腫のリスクが直接変化する」という記述は、以下のDAG因果関係グラフではなく、「アスベストへの曝露」から「中皮腫」への黒い矢印で表されます。 赤い矢印のため、DAGではないという用語を以下の因果関係グラフの説明に使用しています。「アスベストへの曝露は、タバコの煙への曝露が中皮腫のリスクに及ぼす直接的な因果関係の変化を引き起こします」(アスベストは物理的中皮腫のリスクの変化を直接引き起こすことに加えて、肺の細胞への損傷はまた、細胞をタバコの煙への曝露の発がん性の害にさらしやすくし、アスベストとタバコの両方への曝露は、 2つのリスクの合計よりも大きいリスク)、これは、質問の冒頭で説明したDAGの因果的な矢印の正式な意味とは完全に一致しません(つまり、赤い矢印が変数で終了しないため))。 DAGの視覚的形式の中で相互作用の効果を正しく表現するにはどうすればよいですか? 参考文献 Greenland、S.、Pearl、J.、and Robins、JM(1999)。疫学研究の因果図。疫学、10(1):37–48。

1
帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?
順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。 この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。 注: 置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。 更新: 私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35 。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する ますか?-機能Aの対象とV2の機能Bの対象を比較しますか? -V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか? -この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
カテゴリー変数間の相互作用が含まれる場合の混合モデルからの回帰出力の解釈
混合モデル/ lmerの使用について質問があります。基本モデルは次のとおりです。 lmer(DV ~ group * condition + (1|pptid), data= df) グループと条件は両方の要因です。グループには2つのレベル(groupA、groupB)があり、条件には3つのレベル(condition1、condition2、condition3)があります。それは人間の被験者からのデータであるため、pptidは各人のランダムな効果です。 モデルは、p値の出力で以下を見つけました。 Estimate MCMCmean HPD95lower HPD95upper pMCMC Pr(>|t|) (Intercept) 6.1372 6.1367 6.0418 6.2299 0.0005 0.0000 groupB -0.0614 -0.0602 -0.1941 0.0706 0.3820 0.3880 condition2 0.1150 0.1151 0.0800 0.1497 0.0005 0.0000 condition3 0.1000 0.1004 0.0633 0.1337 0.0005 0.0000 groupB:condition2 -0.1055 -0.1058 …

4
「節度」対「相互作用」?
私はこれらの2つの用語に出くわしましたが、これらの用語は多くの文脈で同じ意味で使用されています。 基本的に、モデレーター(M)はXとYの関係に影響を与える要因です。通常、モデレーション分析は回帰モデルを使用して行われます。たとえば、性別(M)は、「製品調査」(X)と「製品購入」(Y)の関係に影響を与える可能性があります。 相互作用では、X1とX2が相互作用してYに影響します。ここで同じ例は、「製品研究」(X1)が「性別」(X2)の影響を受け、一緒に「製品購入」(Y)に影響することです。 節度では、MはXY関係に影響しますが、相互作用では、M(この場合は性別)が他のIVに影響することがわかります。 質問:プロジェクトの目的が性別がXとYの関係にどのように影響するかを確認することである場合、モデレーションまたはインタラクションを使用する必要がありますか? 注:私のプロジェクトは、XとYの因果関係ではなく、XとYの相関関係に関するものです。

1
回帰の比率、別名Kronmalに関する質問
最近、質問をランダムに閲覧すると、回帰モデルでの比率の使用に関する数年前の警告から私の教授の一人からのオフコメントの記憶がトリガーされました。だから私はこれについて読み始め、最終的には1993年のKronmalに至った。 これらをモデル化する方法に関する彼の提案を正しく解釈していることを確認したいと思います。 従属側と独立側の両方で同じ分母を持つ比率のモデルの場合: Z− 1Y= Z− 11nβ0+ Z− 1バツβバツ+ βZ+ Z− 1ϵZ−1Y=Z−11nβ0+Z−1バツβバツ+βZ+Z−1ϵ Z^{-1}Y = Z^{-1}1_n\beta_0 + Z^{-1}X\beta_X + \beta_Z + Z^{-1}\epsilon 他の比率に加えて、(逆)分母変数の回帰依存比率 (逆)分母変数による重み 比率として従属変数を持つモデルの場合: Y= β0+ βバツバツ+ Z1nα0+ Zバツαバツ+ Z− 1ϵY=β0+βバツバツ+Z1nα0+Zバツαバツ+Z−1ϵ Y = \beta_0 + \beta_XX + Z1_n\alpha_0 + ZX\alpha_X + Z^{-1}\epsilon 元の変数、分母、および分母の元の変数による分子の回帰[カテゴリ変数はどうですか?] (逆)分母による重み 独立変数比のみのモデルの場合: Y= β0+ Xβバツ+ Z− 11nβZ− …

1
構造方程式:R lavaanパッケージで相互作用効果を指定する方法
R lavaanパッケージを使用して、構造方程式モデルを推定しています。モデルが、1つの潜在的変数と2つの明示的な説明変数を持つ1つの内在的マニフェスト変数で構成されているとします。 group = {0,1} attitude1 = latent,scale age = respondent's age 目的の溶岩モデルは次のとおりです(機能しません)。 model <- ' attitude1 =~ att1 + att2 + att3 outcome ~ age*group + attitude1*group' 私の目標は、線形回帰でできることの範囲で、各変数とグループの間に主効果と相互作用効果を確立することです。これはできますか?
13 r  interaction  sem  lavaan 

1
比率を分析するための手法
比率とレートの分析に関するアドバイスとコメントを探しています。私が仕事をしている分野では、特に比率の分析が広まっていますが、これが問題になる可能性があることを示唆するいくつかの論文を読みました。 Kronmal、Richard A.1993。スプリアス相関と比率標準の誤りを再検討。Journal of the Royal Statistical SocietyシリーズA 156(3):379-392 および関連論文。私がこれまでに読んだことから、比率は偽の相関を生成し、原点を通る回帰直線を強制し(これは常に適切ではない)、それらをモデリングすると正しく行われないと限界の原則に違反する可能性があります(リチャード・ゴールドスタインによる比率の使用))。ただし、比率の使用が正当化される機会がなければならず、このトピックに関して統計学者からの意見が必要でした。

1
LARSと投げ縄の座標降下
L1正規化線形回帰のあてはめにLARS [1]を使用する場合と座標降下を使用する場合の長所と短所は何ですか? 私は主にパフォーマンスの側面に興味があります(私の問題はN数十万とp20未満にある傾向があります)。しかし、他の洞察も歓迎されます。 編集:私は質問を投稿したので、chlは親切にフリードマンらによる論文[2]を指摘しました。そこでは、座標降下は他の方法よりもかなり速いことが示されています。その場合、実務家として座標降下を支持するLARSを単に忘れるべきですか? [1]エフロン、ブラッドリー。ヘイスティー、トレバー; ジョンストーン、イアンおよびティブシラーニ、ロバート(2004)。「最小角度回帰」。統計32(2):pp。407–499。 [2] Jerome H. Friedman、Trevor Hastie、Rob Tibshirani、「座標降下による一般化線形モデルの正規化パス」、Journal of Statistics Software、Vol。33、1号、2010年2月。

3
グループ比較のための交互作用項と個別の回帰のある共同モデル
以前の質問とディスカッションから貴重なフィードバックを収集した後、次の質問を考え出しました。たとえば、男性と女性の2つのグループ間の効果の違いを検出することを目的としているとします。それには2つの方法があります。 2つのグループに対して2つの別々の回帰を実行し、Waldテストを使用して帰無仮説:を拒否します(ただし、は男性の回帰における1つのIV の係数、は同じ係数です)女性の後退におけるIV。b 1 − b 2 = 0 b 1 b 2H0H0H_0b1−b2=0b1−b2=0b_1-b_2=0b1b1b_1b2b2b_2 2つのグループを一緒にプールし、性別ダミーと交互作用項(IV * genderdummy)を含めることにより、共同モデルを実行します。次に、グループ効果の検出は、相互作用の符号と有意性のt検定に基づいて行われます。 ケース(1)でHoが拒否された場合、つまりグループの違いは有意であるが、ケース(2)での交互作用項の係数は統計的に重要ではない、つまりグループの違いが重要でない場合はどうでしょう。または逆の場合、Hoはケース(1)で拒否されず、交互作用項はケース(2)で重要になります。私は何度もこの結果に終わっており、どの結果がより信頼できるのか、そしてこの矛盾の背後にある理由は何なのかと思っていました。 どうもありがとう!

1
GBMパッケージとGBMを使用したキャレット
私はを使用してモデルのチューニングを行ってきましたがcaret、gbmパッケージを使用してモデルを再実行しています。caretパッケージが使用gbmし、出力が同じである必要があることは私の理解です。ただし、を使用した簡単なテスト実行でdata(iris)は、評価指標としてRMSEとR ^ 2を使用したモデルで約5%の不一致が示されています。を使用して最適なモデルのパフォーマンスを見つけたいが、部分的な依存関係プロットを利用するためにcaret再実行しgbmます。再現性のために以下のコード。 私の質問は次のとおりです。 1)これらの2つのパッケージは同じであっても違いがあるのはなぜですか(確率的ですが、5%がやや大きな違いであることがわかります。特に、次のような素晴らしいデータセットを使用していない場合 iris、モデリングの) 。 2)両方のパッケージを使用する利点または欠点はありますか? 3)無関係:irisデータセットを使用した場合、最適な値interaction.depthは5ですが、読み取り値が最大値floor(sqrt(ncol(iris)))である2 を超えるはずです。これは厳密な経験則ですか、それとも非常に柔軟ですか。 library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric <- "RMSE" trainControl <- trainControl(method="cv", number=10) set.seed(99) gbm.caret <- train(Sepal.Length ~ ., data=iris, distribution="gaussian", method="gbm", trControl=trainControl, verbose=FALSE, tuneGrid=caretGrid, metric=metric, bag.fraction=0.75) …

3
モデレート回帰:予測子間の*積*項を計算するのはなぜですか?
モデレート回帰分析は、2つ以上の予測変数/共変量間の相互作用を評価するために、社会科学でよく使用されます。 通常、2つの予測変数を使用して、次のモデルが適用されます。 Y=β0+β1∗X+β2∗M+β3∗XM+eY=β0+β1∗X+β2∗M+β3∗XM+eY = β_0 + β_1*X + β_2*M + β_3*XM + e モデレーションのテストは、積項XMXMXM(独立変数XXXとモデレーター変数間の乗算)によって操作可能になっていることに注意してくださいMMM。私の非常に根本的な質問は、なぜXXXと間の積項を実際に計算するのMMMですか?なぜ、たとえば、絶対的な違いはありません|M−X||M−X||M-X|または単に合計X+MX+MX + M? 興味深いことに、この問題へのケニーの暗示がここhttp://davidakenny.net/cm/moderation.htmと言って:「としては見られますが、節度のテストは常に、製品の長期XMことによって操作されていない」が、さらに説明が与えられていません。正式なイラストや証拠は啓発的なものになると思います。

1
Stataでインストルメント化された相互作用項を使用してインストルメンタル変数回帰を行う方法は?
Stata構文に少し問題があります。次の回帰を行う必要があります。 y=ax+bz+c(xz)+ey=ax+bz+c(xz)+ey = ax + bz + c(xz) + e ここで、とzの両方が計測され、相互作用項x zは計測されたxとzの値を使用します。xxxzzzxzxzxzxxxzzz とzの予測値を生成し、それらを回帰変数として使用するだけでは、誤った標準誤差が生じます。xxxzzz 編集:また、1つの変数のみが計測され、この1つの計測変数が相互作用項にある状態で、同様の回帰を行う必要があります。

2
SVM、変数相互作用およびトレーニングデータの適合
2つの一般的/より理論的な質問があります。 1)予測モデルを構築するときに、SVMが変数の相互作用をどのように処理するか興味があります。たとえば、f1とf2の2つの機能があり、ターゲットがf1、f2に依存し、f1 * f2(または何らかの関数h(f1、f2))に依存する場合、SVMは適合します(OOSだけでなくトレーニングデータにも)フィーチャにf1、f2、h(f1、f2)を含めると、f1とf2を含めるだけで改善されますか?SVMアルゴリズムは機能の相互作用を処理しますか?SVMがより高次元の空間で超平面を作成しようとする方法と同じように思えますが、質問したいとは思いません。 2)トレーニングデータにSVMをフィッティングするとき、十分な機能と最適なパラメーター(ブルートフォース検索など)を見つけると、SVMは常にトレーニングデータに簡単に適合しますか?正しいことを言ったかどうかはわかりませんが、基本的に、フィーチャに十分な分散/ノイズがある場合、SVMは常にトレーニングデータに100%適合しますか?逆に、SVMがトレーニングデータに100%適合しない場合、データにキャプチャされていないターゲット変数に影響する情報(または他の機能)があることを意味しますか? ありがとう 小さな説明。カーネルSVMを具体的に参照しています

3
相互作用は回帰のコンテキストでのみ有用ですか?
私は常に、回帰という文脈で相互作用という用語を読みました。また、knnやsvmなどの異なるモデルとの相互作用も考慮する必要がありますか? ある場合は、またはさらに多くの機能をしてすることができます言う便利な相互作用を見つけるための通常の方法は何か観測を?すべての組み合わせを試しますか?または、意味のある組み合わせのみを使用しますか?100 1000505050100100100100010001000

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.