複数のグループ(自然なグループが事前に定義されたもの)の線形回帰の場合、次の2つの質問に答えるために、同じデータセットで2つの異なるモデルを実行することは許容できますか?
各グループには非ゼロの勾配と非ゼロの切片がありますか?グループ回帰内の各パラメーターは何ですか?
グループメンバーシップに関係なく、非ゼロの傾向と非ゼロの切片はありますか?グループ全体の回帰のパラメーターは何ですか?
Rでは、最初のモデルはでありlm(y ~ group + x:group - 1)
、推定された係数は各グループの切片と勾配として直接解釈できます。2番目のモデルはですlm(y ~ x + 1)
。
代替案はlm(y ~ x + group + x:group + 1)
、であり、これにより、係数の複雑な要約表が得られ、グループ内の勾配と切片は、いくつかの参照からの勾配と切片の差から計算する必要があります。また、最後のグループの差異(場合によっては)のp値を取得するために、グループを並べ替えてモデルをもう一度実行する必要があります。
これは2つの別個のモデルを使用して、推論に何らかの悪影響を及ぼしますか、またはこの標準的な方法に悪影響を及ぼしますか?
これをコンテキストに入れるために、xを薬物の投与量と見なし、グループを異なる人種と見なします。医師の特定の人種、または薬剤が効く人種の用量反応関係を知ることは興味深いかもしれませんが、(ヒト)母集団全体の用量反応関係を知ることも興味深い場合があります公衆衛生担当官の人種に関係なく。これは、グループ内とグループ全体の両方の回帰に個別に関心を持つ方法の単なる例です。用量反応関係が線形であるべきかどうかは重要ではありません。