バイナリ分類のモデルとしてロジスティック関数を使用する動機は何ですか?


7

バイナリ分類で使用されるロジスティック回帰は、結果変数の潜在的な確率のモデルとしてロジスティック関数を使用します。

このようなモデルをフィッティングするために有用で不可欠ないくつかのプロパティがあります。たとえば、単調に増加し、xが無限大になる傾向があると1になる傾向があり、xが無限大になる傾向があると0になる傾向があります。ただし、これらのプロパティを満たす関数には他のオプションがあります。

それでは、ロジスティック関数は単に便宜上使用されているのでしょうか、それともロジスティック関数が「正しい」または使用するのに適切な関数である理由が他にあるのでしょうか。

回答:


9

1つ以上の変数から確率を推定するための「デフォルト」方法としてロジスティック関数を選択する理由はいくつかあります。ここにいくつかあります:

  1. 歴史的、例えば用量反応曲線
  2. モデルの右側の回帰仕様で使用すると、予測子の個別の効果のオッズ比に関連する可能性があるという点で、回帰効果を解釈できます。
  3. 線形判別分析のように予測子の多変量正規性の仮定から始める場合、ベイズのルールを使用して条件付けを逆にすると、ロジスティックモデルが生成されます。
  4. 形状は実際のデータにかなり適合します

ロジスティックは分類ではなく、直接確率推定に使用されることに注意してください。


2

ロジスティックリンク関数の技術的特徴は、ML推定と組み合わせると(または事後モードとフラット事前分布)、勾配方程式が次のようになることです。

Σバツpy=0

つまり、あなたの残差、 py、共変量とは無相関、 バツ (注意: y バイナリです 0 または 1)。これはols回帰に似ています。別のリンク関数がある場合-リンク関数がロジスティック関数とどの程度異なるかに依存する「重み」を含めることにより、方程式が変更されます。これの実用的な特徴の1つは、モデルに切片を含めると、当てはめられた確率が「成功」の数に達することです(y=1)。同様に因子変数について。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.