@ ken-butlerの答えを少し広げてください。連続変数(時間)と特別な値(時間= 0、または非授乳)のインジケーター変数の両方を追加することにより、「非特別な」値に線形効果があり、特別な値での予測結果。(少なくとも私にとっては)グラフを見るのに役立ちます。以下の例では、回答者(すべての女性)が働く週の時間の関数として時給をモデル化し、週40時間の「標準」について何か特別なものがあると考えています。
(Stataで)このグラフを生成したコードは、http://www.stata.com/statalist/archive/2013-03/msg00088.htmlにあります。
そのため、この場合、他の値とは異なる方法で処理したい場合でも、連続変数に値40を割り当てました。同様に、他の値と質的に異なると思われる場合でも、週の母乳育児に値0を与えます。以下のコメントは、これが問題だと思うと解釈します。これは事実ではなく、相互作用用語を追加する必要はありません。実際、その相互作用項は、試してみると完全な共線性のために削除されます。これは制限ではなく、インタラクション用語が新しい情報を追加しないことを伝えるだけです。
回帰式は次のようになります。
y^=β1weeks_breastfeeding+β2non_breastfeeding+⋯
ここで、は、母乳育児の週数(母乳育児をしていない人の値0を含む)およびn o n _ b r e a s t f e e d i n gは、誰かが母乳を与えていない場合は1、そうでない場合は0であるインジケーター変数です。weeks_breastfeedingN O N _ B用のR E A S T Fe e d私のn グラム
授乳中に何が起こるか考えてください。回帰方程式は次のように単純化されます。
y^= β1w e e k s _ b r e a s t fe e d私のn グラム+ β20 + ⋯= β1w e e k s _ b r e a s t fe e d私のn グラム+ ⋯
だから、母乳ないもののために母乳育児週間の数だけの線形効果です。β1
誰かが母乳育児をしていないときに何が起こっているのかを考えてください:
y^=β10+β21+⋯=β2+⋯
だから、あなたに授乳していないの効果と方程式から滴を母乳育児週間の数を示します。β2
相互作用用語は既に(暗黙的に)存在しているため、相互作用用語を追加する必要はありません。
奇妙な何かがある、それはそれらのその母乳と母乳が、これだけ0週をしない人たちの期待される結果を比較することにより、母乳育児の効果を測定としてしかしそれは「比較に優しい作る感覚の...、のように」のようなものですが、実用的な有用性はすぐには明らかではありません。「非母乳育児」と12週間(約3か月)の母乳育児をしている女性を比較する方が理にかなっているかもしれません。その場合、「非授乳者」にw e e k s _ b r e a s t f e e d i n gの値12を与えるだけです。β2weeks_breastfeeding。あなたが割り当て値に回帰係数に影響を与えない「非breastfeeders」のβ 2が誰「以外と判断するという意味で-母乳育児」が比較されます。問題の代わりに、これは実際には非常に有用なものです。weeks_breastfeedingβ2