ロジスティック回帰(より一般的にはGLM)は機械学習に属しません!むしろ、これらの方法はパラメトリックモデリングに属します。
パラメトリックモデルとアルゴリズム(ML)モデルはどちらもデータを使用しますが、方法は異なります。アルゴリズムモデルは、予測子が予測子にどのようにマッピングされるかをデータから学習しますが、観測値を生成したプロセスに関する仮定は行いません(実際には他の仮定も行いません)。彼らは、入力変数と出力変数の間の基礎となる関係は複雑で不明であると考えているため、正式な方程式を課すのではなく、データ駆動型アプローチを採用して何が起こっているかを理解します。
一方、パラメトリックモデルは、検討するプロセスの知識に基づいてアプリオリに処方され、データを使用してパラメーターを推定し、実際にはほとんど保持されない非現実的な仮定(独立、等分散、エラーの正規分布)。
また、パラメトリックモデル(ロジスティック回帰など)はグローバルモデルです。データ内のローカルパターンをキャプチャすることはできません(ツリーをベースモデルとして使用するMLメソッドとは異なり、たとえばRFやBoosted Trees)。このペーパー 5ページを参照してください。修復戦略として、ローカル(つまり、ノンパラメトリック)GLMを使用できます(たとえば、locfit Rパッケージを参照)。
多くの場合、基礎となる現象に関する知識がほとんどない場合、データ駆動型のアプローチを採用し、アルゴリズムモデリングを使用することをお勧めします。たとえば、入力変数と出力変数の相互作用が線形でない場合にロジスティック回帰を使用すると、モデルは明らかに不適切になり、多くの信号がキャプチャされません。ただし、プロセスが十分に理解されている場合、パラメトリックモデルには、すべてを要約する公式の方程式を提供するという利点があり、これは理論的な観点から強力です。
より詳細な議論については、Leo Breimanによるこの素晴らしい論文を読んでください。