タグ付けされた質問 「interaction」

説明変数の効果が別の説明変数の値に依存する状況。

9
ランダムフォレストから知識を取得する
ランダムフォレストはブラックボックスと見なされますが、最近、ランダムフォレストからどのような知識が得られるのかと考えていましたか? 最も明白なことは、変数の重要性です。最も単純なバリアントでは、変数の出現回数を計算するだけでそれを行うことができます。 私が考えていた2番目のことは相互作用です。木の数が十分に大きければ、変数のペアの出現回数をテストできると思います(カイ二乗独立のようなもの)。3番目のことは、変数の非線形性です。私の最初のアイデアは、変数対スコアのチャートを見ることでしたが、それが意味をなすかどうかはまだわかりません。 追加された2012.01.2012 動機 この知識を使用して、ロジットモデルを改善したいと思います。見落とされた相互作用と非線形性を見つけることは可能だと思います(または少なくとも希望します)。


7
すべての相互作用の用語は、回帰モデルの個々の用語を必要としますか?
著者が5〜6個のロジット回帰モデルをAICと比較している原稿を実際にレビューしています。ただし、一部のモデルには、個々の共変量項を含まない相互作用項があります。これを行うのは理にかなっていますか? 例(ロジットモデルに固有ではない): M1: Y = X1 + X2 + X1*X2 M2: Y = X1 + X2 M3: Y = X1 + X1*X2 (missing X2) M4: Y = X2 + X1*X2 (missing X1) M5: Y = X1*X2 (missing X1 & X2) 相互作用用語X1 * X2がある場合、X1 + X2も必要であるという印象を受けていました。したがって、モデル1と2は問題ありませんが、モデル3〜5には問題があります(AICが低い場合でも)。これは正しいです?それはルールですか、それともガイドラインですか?この背後にある理由を説明する良い参考資料はありますか?レビューで重要なことを誤解しないようにしたいだけです。 考えをありがとう、ダン

2
lmで相互作用用語を書く別の方法は?
回帰モデルで相互作用を指定する最良の方法はどれかという質問があります。次のデータを考慮してください。 d <- structure(list(r = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), .Label = c("r1","r2"), class = "factor"), s = structure(c(1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, …

5
相互作用の影響を識別するベストプラクティスは何ですか?
モデル内の変数の可能な組み合わせを文字通りテストする(x1:x2またはx1*x2 ... xn-1 * xn)以外。独立変数(できれば)の間に相互作用が存在するべきか、そうでないのかをどのように識別しますか? 相互作用を特定しようとする際のベストプラクティスは何ですか?使用できる、または使用できるグラフィカルな手法はありますか?

1
GAMのテンソル製品の相互作用の背後にある直観(RのMGCVパッケージ)
一般化された加法モデルは 、たとえばモデル です。関数は滑らかで、推定されます。通常、罰せられたスプラインによって。MGCVはRのパッケージであり、著者(Simon Wood)はRの例を含む彼のパッケージに関する本を書いています。ルパート等 (2003)同じもののより単純なバージョンについて、はるかにアクセスしやすい本を書いてください。 y=α+f1(x1)+f2(x2)+eiy=α+f1(x1)+f2(x2)+ei y = \alpha + f_1(x_1) + f_2(x_2) + e_i 私の質問は、これらの種類のモデル内の相互作用についてです。次のようなことをしたい場合: OLS土地にいた場合(は単なるベータです) 、解釈に問題はありません。ペナルティスプラインを介して推定する場合、加算コンテキストでの解釈にも問題はありません。 y=α+f1(x1)+f2(x2)+f3(x1×x2)+eiy=α+f1(x1)+f2(x2)+f3(x1×x2)+ei y = \alpha + f_1(x_1) + f_2(x_2) + f_3(x_1\times x_2) + e_i ffff^3f^3\hat{f}_3 ただし、GAMのMGCVパッケージには、「テンソル積平滑化」と呼ばれるものがあります。私は「テンソル製品」をグーグルで検索し、見つけた説明を読もうとするとすぐに目が輝いた。私は十分に頭が良くないか、数学があまりうまく説明されていないか、またはその両方です。 コーディングの代わりに normal = gam(y~s(x1)+s(x2)+s(x1*x2)) テンソル製品は同じ(?) what = gam(y~te(x1,x2)) 私がする時 plot(what) または vis.gam(what) 本当にクールな出力が得られます。しかし、私はブラックボックス内で何が起こっているのte()か、また前述のクールな出力をどのように解釈するのか分かりません。先日、セミナーを開催しているという悪夢に見舞われました。みんなにクールなグラフを見せて、それが何を意味するのかと尋ねましたが、知りませんでした。それから私は服を着ていないことを発見しました。 ここのボンネットの下で何が起こっているのかについて少しのメカニズムと直感を与えることで、誰も私と後世の両方を助けることができますか?理想的には、通常の加法相互作用の場合とテンソルの場合の違いについて少し言ってください。数学に進む前に、すべてを簡単な英語で言うことのボーナスポイント。

3
R:データセットにNaNがないにもかかわらず、「Forest function call」エラーでNaN / Infをスローするランダムフォレスト[非公開]
キャレットを使用して、データセットに対してクロス検証されたランダムフォレストを実行しています。Y変数は要因です。データセットにNaN、Inf、またはNAはありません。ただし、ランダムフォレストを実行すると、 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs introduced by coercion 3: In data.matrix(x) : NAs introduced by …

3
なぜ独立変数を中央揃えすると、節度によって主効果が変わるのでしょうか?
このCVスレッドに触発された重回帰と相互作用に関連する質問があります:中心変数階層回帰分析を使用した相互作用項?どの変数を中心にすべきか? 節度効果を確認するとき、相互作用項を計算するために、独立変数を中央に配置し、中央に配置した変数を乗算します。次に、回帰分析を実行し、主効果と相互作用効果を確認します。 センタリングせずに分析をやり直した場合、明らかに決定係数()は変わりませんが、回帰係数()は変わります。それは明確で論理的なようです。R2R2R^2ββ\beta 理解できないこと:主効果のp値はセンタリングによって大幅に変化しますが、相互作用はそうではありません(正しい)。したがって、私の主な効果の解釈は劇的に変わる可能性があります-センタリングによって決定されるだけです。(両方の分析で同じデータです!) 誰かが明らかにできますか?-それは、変数を中央に配置するオプションが必須であり、誰もが同じデータで同じ結果を得るためにそれを行う必要があることを意味するためです。 その問題と包括的な説明を配布してくれてありがとう。あなたの助けが非常に高く評価されることを保証してください! 私にとって、センタリングの最大の利点は、多重共線性を回避することです。中央に配置するかどうかに関係なく、ルールを確立することは依然としてかなり混乱しています。私の印象では、ほとんどのリソースが集中することを示唆していますが、それを行う際に「リスク」がいくつかあります。繰り返しますが、同じ資料とデータを扱う2人の研究者が異なる結果を結論付ける可能性があるという事実を出したいと思います。私はちょうどボルツの本の一部を読みました(彼は教授であり、ドイツとヨーロッパの統計スターの一種でした)。彼はその手法についても言及していません。変数が相互作用に関与している場合、変数の主な効果を解釈する際には注意が必要であると指摘しています。 結局、1つのIV、1つのモデレーター(または2番目のIV)、およびDVを使用して回帰を実行する場合、中央に配置することをお勧めしますか?



3
カテゴリー変数を使用したロジット回帰の相互作用項の解釈
私は、回答者が4つのグループのいずれかにランダムに割り当てられた調査実験のデータを持っています。 > summary(df$Group) Control Treatment1 Treatment2 Treatment3 59 63 62 66 3つの治療グループは適用される刺激がわずかに異なりますが、私が気にする主な違いはコントロールと治療グループの間です。そこで、ダミー変数を定義しましたControl: > summary(df$Control) TRUE FALSE 59 191 調査では、回答者は(特に)次の2つのうちどちらを優先するかを選択するように求められました。 > summary(df$Prefer) A B NA's 152 93 5 次に、治療グループによって決定されたいくつかの刺激を受けた後(対照グループの場合は刺激なし)、回答者は同じ2つのことから選択するように求められました。 > summary(df$Choice) A B 149 101 3つの治療グループのうちの1つに属していることが、この最後の質問で回答者が行った選択に影響を与えたかどうかを知りたいです。私の仮説は、治療を受けた回答者が治療するよりAも選択する可能性が高いということですB。 カテゴリデータを使用していることを考えると、ロジット回帰を使用することにしました(それが間違っていると思われる場合はお気軽にご連絡ください)。回答者はランダムに割り当てられたため、他の変数(人口統計など)を必ずしも制御する必要はないという印象を受けているため、この質問ではそれらを省略しました。私の最初のモデルは単純に次のものでした: > x0 <- glm(Product ~ Control + Prefer, data=df, family=binomial(link="logit")) > summary(x0) Call: glm(formula …

3
シンプソンのパラドックスを理解する:性別と身長で収入が減少するアンドリュー・ゲルマンの例
Andrew Gelmanは最近のブログ投稿の1つで次のように述べています。 私はシンプソンのパラドックスに反事実または潜在的な結果が必要だとは思わない。シンプソンのパラドックスを、操作できない変数で設定したり、操作に直接興味がない変数で設定したりできるためです。 シンプソンのパラドックスは、より多くの予測変数を追加すると回帰係数が変化するというより一般的な問題の一部であり、符号の反転は実際には必要ありません。 以下は、両方のポイントを説明する私の指導で使用する例です。 性別と身長から収入を予測する回帰を実行できます。性別の係数は10,000 ドル(つまり、同じ高さの男性と女性を比較すると、平均して男性は10,000 ドル多くなります)、高さの係数は500 ドル(つまり、2人の男性または2人の女性を比較)身長が異なる場合、平均して背の高い人は身長1インチあたり500 ドル多くなります)。 これらのcoefをどのように解釈できますか?私は確かにそれは高さに退行に何らかの形で「間違っている」と思われる、(それは高さの異なる同性の2人を比較すると想像するのは簡単です)高のCOEFが解釈しやすいと感じずに生の限り、セックスのための制御します背の低い人と背の高い人の違いは、男性と女性の違いであることによって「説明」できます。しかし、上記のモデルの性別を解釈するのは非常に難しいようです。たとえば、両方の身長が66インチの男性と女性を比較するのはなぜでしょうか。これは、背の低い男性と背の高い女性の比較になります。この推論はすべて漠然と因果関係にあるように見えますが、潜在的な結果を使用してそれを考えることは理にかなっていないと思います。 私はそれについて熟考し(そして投稿にコメントしさえしました)、ここでより明確に理解されるように懇願する何かがあると思います。 性別の解釈に関する部分までは大丈夫です。しかし、私は背の低い男性と背の高い女性を比較することの背後にある問題が何であるかわかりません。私のポイントは次のとおりです。実際、それはさらに意味があります(男性は平均して背が高いと仮定すると)。収入の違いは高さの違いによって何らかの部分で説明されるというまったく同じ理由で、「背の低い男性」と「背の低い女性」を比較することはできません。同じことは背の高い男性と背の高い女性にも当てはまり、さらに背の低い女性と背の高い男性にも言えます(いわば、それはさらに問題外です)。したがって、基本的に身長の影響は、背の低い男性と背の高い女性を比較する場合にのみ排除されます(これは、性別の係数の解釈に役立ちます)。人気のマッチングモデルの背後にある同様の基礎概念に鐘を鳴らしていませんか? シンプソンのパラドックスの背後にある考え方は、人口効果がサブグループごとの効果とは異なる可能性があるということです。これはある意味で彼のポイント2と、高さを単独で制御すべきではないことを認めているという事実に関連しています(変数バイアスの省略)。しかし、私はこれを性別の係数に関する論争と関連付けることはできませんでした。 それをもっとはっきりと表現できるかもしれませんか?または私の理解についてコメントしますか?

3
相互作用効果が重要でない場合、主な効果をどのように解釈しますか?
Rで一般化線形混合モデルを実行し、2つの予測子間の相互作用効果を含めました。相互作用は重要ではありませんでしたが、主な効果(2つの予測子)は両方とも重要でした。今、多くの教科書の例は、相互作用の重要な効果がある場合、主な効果は解釈できないことを教えてくれます。しかし、相互作用が重要でない場合はどうでしょうか? 2つの予測子が応答に影響を及ぼすと結論付けることはできますか?または、インタラクションを省いた新しいモデルを実行する方が良いでしょうか?複数のテストを制御する必要があるため、そうしないことを好みます。

1
相互作用を含めることができる2因子ANOVAのノンパラメトリックな同等物は何ですか?
こんにちは、相互作用を含めることができる双方向ANOVA(3x4設計)のノンパラメトリックな同等物を見つけようとしています。Zar 1984「生物統計学的分析」の私の読書から、これはシャイラー、レイ、およびヘア(1976)で述べられた方法を使用して可能ですが、オンラインの他の投稿によると、この方法はもはや適切ではないと推測されましただった)。 誰がそれを行うのに適切な方法を知っていますか?もしそうなら、RまたはStataの対応する機能は?

5
実験計画のブロックとは何ですか?
実験計画におけるブロックの概念について2つの質問があります。(1)ブロックと因子の違いは何ですか?(2)いくつかの本を読んでみましたが、はっきりしないことがあります。著者は、「ブロック要因」と他の要因の間に相互作用がないと常に仮定しているようです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.