ロジスティック回帰がロジスティック分類と呼ばれないのはなぜですか?


75

ロジスティック回帰はカテゴリ依存変数を扱う統計的分類モデルなので、なぜロジスティック分類と呼ばれないのですか?「回帰」名は、連続従属変数を扱うモデルに予約すべきではありませんか?


5
ロジスティック回帰はモデルのGLMファミリーに属します。
ステファンローラン14

10
これを使用して、確率を回帰できます。
エムール14

25
ロジスティック回帰は、それが返す確率にしきい値を導入することで確実に分類に使用できますが、それが唯一の使用であるとは限りません。分類とは関係のない回帰目的のために開発され、引き続き使用されます。私はこれがまだほとんど使用されているものであることはまだ簡単だと主張しますが、それはあなたが見ているものに依存すると思います。
Glen_b 14

6
ロジスティック回帰の開発に関するこの論文は、特に回帰手法として使用される問題の種類をある程度理解できるので、おもしろいかもしれません。
Glen_b

回答:


102

ロジスティック回帰は、それ自体では分類アルゴリズムではありません。結果の予測確率を二分するのは、決定ルールと組み合わせた分類アルゴリズムのみです。ロジスティック回帰、クラスメンバシップの確率を特徴の(変換)多重線形関数として推定するため、回帰モデルです。

フランク・ハレルは、ロジスティック回帰を分類アルゴリズムと見なすことの落とし穴を列挙した多数の回答をこのWebサイトに投稿しています。その中で:

私の記憶が正しければ、彼はかつてこれらの(そしてもっと!)ポイントをさらに詳しく説明する回帰戦略に関する本を教えてくれましたが、その特定の投稿を見つけることができないようです。


1
その場合、すべての(またはほとんどの)分類器は最初に(私の知る限り)クラスに属する確率を予測し、次にこの確率をクラスに変換します。
外れ値14

9
@Outlier Counterexample:SVMはクラス確率をまったく計算せず、観測と超平面の間の距離を測定するだけです。
モニカの復活14

MLの@Outlierは、確率的分類器と呼ばれます。木とランダムフォレストはありません。xgboostは-少なくともloglossがあります)
seanv507

12

要約すると、回帰は条件付き期待値を計算する問題です。この予想によってとられる形式は、データがどのように生成されたかの仮定に応じて異なります。E[Y|X=x]

  • (Y | X = x)が正規分布であると仮定すると、古典的な線形回帰が得られます。
  • ポアソン分布を仮定すると、ポアソン回帰が得られます。
  • ベルヌーイ分布がロジスティック回帰をもたらすと仮定します。

「回帰」という用語は、これよりも一般的に使用されており、特定の分位数を推定する分位点回帰のようなアプローチを含みます。(Y|X=x)


-3

既に提供されている良い答えとは別に、ロジスティック回帰では、0から1の範囲の確率(連続値)が予測されます。

ここに画像の説明を入力してください

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.