対数線形モデルを調査データの多数の変数に適合させようとしています。代わりにロジスティック回帰をそのデータに当てはめることが望ましい場合があるいくつかの理由があります。いくつかの当局は、これらは同等であると示唆しています。しかし、私はこれを疑ういくつかの理由があります。
- 対数線形モデルはすべての変数を同等に扱いますが、ロジスティック回帰では1つの変数を応答変数として識別する必要があります。
最小二乗のコンテキストでは、Y = a + bX +ε対X = c + dY +εの場合、パラメーターdが約1 / bに等しいことは一般的ではありません。これは、最初の方程式が垂直誤差を最小限に抑え、2番目の方程式が水平誤差を最小限に抑えるためです。これらは、推定された線の周りで誤差が対称である場合にのみ等しくなります。そのため、これがロジスティック回帰にも当てはまるのではないかと心配しています。(2)は、実際には(1)の特定の形式にすぎません。つまり、特定の変数を応答として選択することにより、回帰形式で非対称になる可能性があります。
対数線形モデルのすべての変数が1つ以上の交互作用項に含まれている場合、ロジスティック回帰がどのように等価になるかはわかりません。応答変数がロジスティック回帰のコンテキストに含まれる相互作用をどのように表現しますか?
Bill Huberに応えて、私はWikipediaよりもかなり制限された意味で対数線形モデルという用語を使用しています。テーブルに配置されたカテゴリーまたは順序カウントデータのモデルを参照します。係数はテーブルカウントの合計、各因子のマージナルカウントをテーブルカウントの合計(確率のプロキシとして機能)で割った値、およびさまざまな交互作用項です。これは、とりわけ、Agrestiで使用されている「カテゴリデータ分析」の意味です。