ロジスティック回帰が機械学習アルゴリズムと呼ばれるのはなぜですか?


19

機械学習アルゴリズムで正しく理解できた場合、モデルはその経験から学習する必要があります。つまり、モデルが新しいケースに対して間違った予測を与える場合、モデルは新しい観測に適応する必要があり、やがてモデルはますます良くなります。ロジスティック回帰にはこの特性があるとは思えません。では、なぜ機械学習アルゴリズムと見なされているのでしょうか?「学習」という用語でのロジスティック回帰と通常の回帰の違いは何ですか?

ランダムフォレストについても同じ質問があります!

そして、「機械学習」の定義は何ですか?


4
文法を明確にするために質問を編集しましたが、全体的な意味がわかりません...ロジスティック回帰は分類アルゴリズムであるため、MLに該当します。機械学習は、アルゴリズムが適応的である必要があることを意味しません(ただし、新しい観測から学習するアルゴリズムがあります)。適応はより多くの実装の選択肢であり、通常、結合確率をモデル化する生成機械学習アルゴリズムによって実現されます。
ジュバル

12
「機械学習」は、かなり大まかに定義された概念です。実際、モデルの適合を伴うすべての統計手順は、機械学習と考えることができます。(モデルのフィッティングは、ある程度までコンピューターで行えると仮定しています!)。これは、なぜ「ビッグデータ」、「機械学習」などの統計情報が何であるかについての海域muddying社会に不満をいくつかの統計学者のget(とではありませんが!)
P.Windridge


1
@ P.Windridge:「モデルの適合を伴うすべての統計的手順が機械学習と考えることができる場合」ので、なぜ機械学習と統計を区別する必要があるのか​​分からない
Metariat

4
@XuanQuangDOおそらく機械学習と統計を区別すべきではありません。
Sycoraxが復活モニカ言う

回答:


21

機械学習は明確に定義された用語ではありません。

実際、「機械学習の定義」をGoogleで検索すると、最初の2つの結果はまったく異なります。

WhatIs.comから、

機械学習は人工知能(AI)の一種であり、明示的にプログラムしなくてもコンピューターに学習機能を提供します。機械学習は、新しいデータにさらされたときに成長と変化を身に付けることができるコンピュータープログラムの開発に焦点を当てています。

ウィキペディアから、

機械学習では、データから学習して予測を行うことができるアルゴリズムの構築と研究を検討します。

ロジスティック回帰は間違いなくウィキペディアの定義に適合し、それがWhatIsの定義に適合するかどうかを議論することができます。

私は個人的にウィキペディアと同じように機械学習を定義し、統計のサブセットと考えています。


1
あなたが言ったことのほとんどに同意しますが、それは統計のサブセットです。大きな重複がありますが、強化学習など、実際には統計のサブセットと見なすことができない種類の学習があります。
ジョージ

2
これらは良いソースではありません。
ニールG

@George Right、しかしそれに直面しましょう。すべてのデータ収集、分析、およびモデリングの方法論にラベルを適用しなければならなかった場合、それが機械学習、監視ありまたは監視なし、パラメータまたはノンパラメトリック、すべての統計です。MLは統計学の専門分野です。
-RobertF

@RobertF同意しない。機械学習は、機械の学習方法を研究する分野です。MLで使用されるほとんどの方法は統計的方法と見なすことができますが、フィールドは本質的に統計のサブフィールドではありません。たとえば、マルコフ決定プロセスは統計的手法とは考えられません。
ジョージ

1
@George離散時間マルコフモデルは確率モデルです。統計手順の教科書定義である確率モデルの未知のパラメーター(マルコフ決定プロセスなど)を推定したら。統計ではなくMLと呼ばれるアクティビティのメインクラスは、チェスをするロボットの構築などの特定のアプリケーションだと思います。基礎となるアルゴリズムには間違いなく確率と統計が関係しますが、アプリケーションは実際には「統計」ではありません。ゲノミクス研究が統計を多用しているようなものですが、明らかに異なる分野です。
-ahfoss

20

機械学習は熱く、そこにお金があります。人々は、現在売れているものを売ろうとしているものを「売る」と呼びます。それはソフトウェアを販売することができます。それは、昇進しようとする現在の従業員、将来の従業員、コンサルタントなどとして自分自身を売ることができます。機械学習を改善したセクスティングアプリを作成するための鍵となる、彼/彼女のホットな新しいスタートアップ。ソフトウェアは機械学習を行うものであり、人々は機械学習の専門家です。なぜなら、それが注目されているため、少なくとも今のところは売れているからです。

30年以上前に、あらゆる種類の線形および非線形統計モデルのフィッティングを行いました。当時は機械学習と呼ばれていませんでした。今では、そのほとんどがそうです。

全員とその叔父がデータの「科学者」になったように。それは暑い、それはおそらくセクシーだから、それは人々が自分自身と呼ぶものです。そして、それは、誰かがポジションをリストするのを雇うために予算を承認されなければならない採用マネージャーです。そのため、数学、確率、統計、最適化、または数値/浮動小数点計算に関する最初のことを知らない人は、実装の疑わしい正確さと堅牢性のRまたはPythonパッケージを使用し、機械学習アルゴリズムとしてラベル付けされます。理解していないデータに適用し、その経験に基づいて自分自身をデータサイエンティストと呼びます。

これは軽快に聞こえるかもしれませんが、私はそれが状況の本質であると信じています。

編集: 2019年9月26日に以下がツイートされました:

https://twitter.com/daniela_witten/status/1177294449702928384

Daniela Witten @daniela_witten「資金を調達するときはAIであり、採用するときは機械学習であり、作業を行うときはロジスティック回帰です。」

(誰がこれを思いついたのか分かりませんが、それは宝石です💎)


16
私はこれらの意見のいくつかを共有し、他の人に同情的であることを隠しません。ただし、SEサイトでの回答として適切であるためには、何らかのサポートが必要です。明らかにそれは演ductive的な推論によるものではありません。それは事実を暗示することおよび/または信頼できる情報源を引用することから来なければなりません。それができたらいいですね!
whuber

10
このサイトで今日読んだ最も面白い投稿であり、そのほとんどに同意します。しかし、@ whuberは、現在の形式では質問に実際には答えていないことに同意する必要があります。
ニックコックス

6
小さな説明として。私はソフトウェア開発と悪意のある「データサイエンス」の両方で働いています。私は多くの人にインタビューします。仕事をするスキルを持たないソフトウェア開発職とデータサイエンス職の面接の割合はほぼ同じです。それでは、データサイエンスタイトルの特別な点は何ですか?人々はすべての技術分野でスキルを高めようとしています。プログラミングスタック交換には、同じ不満の多くがあると確信しています。
マシュードゥルーリー

7
これは答えというよりも暴言のように感じます。確かに、名前が変わり、ブランディングが重要であり、機械学習が盛んです(したがって、自分が何をしているかわからない多くの自称プラクティショナーがいます)。しかし、研究と産業界の両方で確立され、非常に関連性のある分野を軽視するための議論としてそれを使用することは、私にとっては安価に思えます。
マーククレセン

7
@ MarkL.Stone私はあなたの状況を理解しており、多くの無能な挿入ホット用語がここにあることに完全に同意します。しかし、私の意見では、そのような人々が仕事を見つけて(そして続けて!)いるという事実は、経営の責任です。マネージャーがアナリストの結果に不満を抱いており、個々のスキル/結果に関係なくすべてのアナリストを同じように扱う場合、経営陣は悪いアナリストと同様に無能です。現金の匂いがある仕事には、たまに薬があります。データサイエンティスト/機械学習者に関する大まかな一般化は、すべてのアナリストに対する不信感と同じくらいひどいものです。
マーククレセン

18

他の人がすでに述べたように、統計、機械学習、人工知能などの間には明確な分離がないので、一粒の定義を定義してください。ロジスティック回帰は、おそらく機械学習ではなく統計としてラベル付けされることが多いでしょう。一方、ニューラルネットワークは通常、機械学習としてラベル付けされます(ニューラルネットワークは多くの場合、ロジスティック回帰モデルの単なるコレクションです)。

私の意見では、機械学習は何らかの形でモデルを構築することにより、データから何らかの形で学習できる方法を研究しています。SVM、ニューラルネットワーク、ランダムフォレスト、その他の多くの手法のようなロジスティック回帰は、モデルの構築時にデータから学習します。

機械学習アルゴリズムで正しく理解できた場合、モデルはその経験から学習する必要があります

それは実際に機械学習が通常定義される方法ではありません。すべての機械学習方法が、新しいデータに動的に適応するモデルを生成するわけではありません(このサブフィールドはオンライン学習と呼ばれます)。

「学習」という用語でのロジスティック回帰と通常の回帰の違いは何ですか?

多くの回帰法は、機械学習(SVMなど)にも分類されます。


2
教師なし学習は依然として(機械)学習と呼ばれるため、何かを「機械学習」として分類するためにフィードバックループを必ずしも持つ必要はありません。
-vsz

これは質問のトピックではありませんが、この回答はAIとMLの分離についても言及しています。:私はいつもAIのこの定義は言っていen.wikipedia.org/wiki/...
デイビス吉田を

10

ロジスティック回帰は、1958年に統計学者DR Coxによって発明されたため、機械学習の分野に先駆けて登場しました。ロジスティック回帰は分類方法ではありません、よろしくお願いします。これは直接的な確率モデルです。

アルゴリズムに2つのフェーズ(最初の推測、次に予測「エラー」を「修正」)が必要だと思われる場合は、これを考慮してください。つまり、加法(ロジット)モデルの空間で。ロジスティック回帰は、多くの機械学習手法の直接の競争相手であり、予測子が主に相加的に作用する場合(または主題の知識が相互作用を正しく事前に指定する場合)にそれらの多くより優れています。ロジスティック回帰を機械学習の一種と呼ぶ人もいますが、ほとんどはそうではありません。いくつかの機械学習法(ニューラルネットワークが例です)統計モデルを呼び出すことができます。


1
おかしなことにAmazonの機械学習サービスは1つのアルゴリズム(afaik)のみを使用します- ロジスティック回帰 - 分類タスクに:p aws.amazon.com/machine-learning/faqs
stmax

オンライン学習の問題のように、データを少しずつ提示するだけでもかまいません。その場合、ロジスティック回帰は「最初から正しく機能しません」。私は徐々に学びます。標準損失があり、その更新は勾配降下の標準アプリケーションです。ロジスティック回帰は、私が見たすべての機械学習の教科書にあります。
ニールG

1
データをインクリメンタル方式でサンプリングできるという事実は、どのような推定値にも当てはまる可能性があるため、それを別にしてください。対数尤度関数の1次および2次導関数が分析的に利用可能なロジスティックモデルなどの方法では、超高速ニュートンラプソン法とステップ半分を使用して、切片を除き初期推定値をゼロに設定してを推定します。β
フランクハレル

@FrankHarrell:そうです、それがロジスティック回帰問題の解の最尤推定の進め方です。
ニールG

ロジスティック回帰は、「機械学習」という用語よりも前のものかもしれませんが、フィールドよりも前のものではありません。SNARCは1951年に開発され、学習マシンでした。また、ロジスティック回帰は確率のみをモデル化し、それ自体は分類子ではないという主張は、髪の毛の分裂です。そのロジックにより、ニューラルネットワークは分類子ではありません(出力層がバイナリニューロンで構成されている場合を除き、逆伝播は不可能になります)。
イゴールF.

8

ここでの回答の大部分に反対し、機械学習を主張する必要があります範囲は非常に正確で、統計とは明確に区別されます。MLは長い歴史を持つコンピューターサイエンスのサブフィールドであり、最近ではドメイン外のアプリケーションが見つかっています。MLの父方のフィールドとアプリケーションドメインは、人工知能(ロボット、パターン認識ソフトウェアなど)内にあるため、「ビッグデータ」や「データサイエンス」のような「ホットな用語」ではありません。一方、統計(「状態」という言葉に由来する)は、機械ではなく人間のためのツールとして、社会科学および経済科学の中で開発されました。MLは統計とは別に進化し、統計原理に大きく依存し始めた途中のどこかでも、統計のサブフィールドではありません。MLと統計は補完的なものであり、重複するフィールドではありません。

長い答え

その名前が示すように、MLメソッドはソフトウェア/マシン用に作成され、統計メソッドは人間用に作成されました。MLと統計の両方がデータの予測を処理しますが、MLメソッドはノンパラメトリック自動化アプローチに従いますが、統計メソッドは追加の説明要素を使用して大量の手動モデル構築作業を必要とします。これは、ロボットソフトウェアに統合されることを意図した自動化された予測作成の手段としてMLアルゴリズムがAI研究で開発されたと考える場合に完全に理にかなっています(音声認識や顔認識など)。「マシン」が予測を行うとき、その背後にある理由を気にしません。マシンは、電子メールをスパムまたは非スパムとして分類するモデルの背後にあるドライバー/予測子を知ることを気にせず、予測の精度が最高であることだけを気にします。ブラックボックス、それは彼らがモデルを持っていないからではありません、それはモデルがアルゴリズム的に構築され、人間にも機械にも見えないことを意図していないからです。

MLの「トレーニング」の概念は計算能力に依存していますが、パラメータ推定のためのOLSタイプの方法による統計モデルの構築は、人間の専門家の知識に依存しています。重回帰シナリオでは、モデルを選択し、必要なすべての統計的仮定を検証するために専門家の判断を使用するのは統計学者次第です。統計学者の目標は、パターンを見つけて予測に使用するだけでなく、MLよりもはるかに深くデータと問題を理解することです。

もちろん、多くの分野の場合のように、MLと統計が重複する場合があります。ロジスティック回帰はこれらの機会の1つです。もともと統計的手法であり、単純なパーセプトロン(最も基本的なML手法の1つ)と非常によく似ているため、ML手法と見なされる人もいます。


1
おそらく、ノンパラメトリック統計、ノンパラメトリック統計モデル、モデル構築について聞いたことがないでしょうか?
マークL.ストーン

1
はい、ノンパラメトリック統計を毎日使用しています。MLが統計に対するノンパラメトリックな答えであるとは言わなかったが、MLメソッドがノンパラメトリックであると副作用として現れることがわかりました。ノンパラメトリック統計は、パラメトリック統計が失敗した場合の統計学者の代替オプションですが、それでも専門家の意識的な選択の結果です。私はおそらく自分の意見を伝えることについて十分に明確ではないので、謝罪します。
ディジオ

3
ノンパラメトリックモデル、統計を常時行う統計学者はたくさんいます。統計学者によって発明され、統計学者によって使用され、非常にノンパラメトリックですが、セミパラメトリックな方法で使用することもできます。だから私はあなたに同意しないが、私はあなたに反対票を投じなかった。
マークL.ストーン

1
意見の相違は問題ありませんが、あなたの反論が何であるかはまだよくわかりません。ノンパラメトリック統計には機械学習の必要がないことを暗示していますか(私は決して否定しませんでした)。または、機械学習は実際にはノンパラメトリック統計の別の名前(私が否定したこと)であると主張していますか?
デジオ

3
ここには多くの意見の相違があります。多変数回帰モデルを最新の統計ツールと組み合わせて使用​​すると、柔軟であり、MLとの競争力が高まります。
フランクハレル

3

機械学習はかなり大まかに定義されており、ロジスティック回帰モデルだけでなく、回帰モデルもデータから「学習」すると考えるのは正しいことです。これが機械学習が本当に統計であるのか、統計が本当に機械学習であるのか、あるいはこれが重要なのかどうかは、よくわかりません。

k

ただし、一部のアルゴリズムは予測エラーから学習します。これは、エージェントが何らかのアクションを取り、その結果を観察し、その結果を使用して将来のアクションを計画する強化学習で特に一般的です。たとえば、ロボット掃除機は、すべての場所を同じ頻度で掃除する世界のモデルから開始し、汚れた場所(汚れを見つけることで「報われる」)を掃除し、場所を少なくすることを学習します。

オンラインまたは増分アルゴリズムは、新しいトレーニングデータで繰り返し更新できます。これは必ずしもモデルの予測精度に依存するわけではありませんが、たとえば、現在のモデルでは新しいデータが非常に低いと思われる場合、重みがより積極的に更新されるアルゴリズムを想像できます。ロジスティック回帰のオンラインバージョンがあります。たとえば、McMahan and Streeeter(2012)などです。


3

私はついにそれを理解しました。統計モデルのフィッティングと機械学習の違いがわかりました。

  • モデルを当てはめる(回帰)場合、それは統計モデルのあてはめです
  • モデルを学習する場合(回帰)、それは機械学習です

したがって、ロジスティック回帰を学習する場合、それは機械学習アルゴリズムです。

コメント:古いギーザーであることを容赦してください。しかし、モデルの学習や退行の学習について人々が話しているのを聞くたびに、ジェスロを「私は教育を学んだ」と思うようになります。

スレッドの終わり


??? ロジスティクスモデルを学ぶこともできます。
SmallChess

1
@Student T、ロジスティックスモデルに適合した場合、それは統計モデル適合です。ロジスティクスモデル、つまり機械学習を学習する場合、つまり、実際にはさまざまな分野で使用されている用語の問題です。同じことは、フィールドごとに異なるものと呼ぶことができます(統計と機械学習)。
マークL.ストーン

0

ロジスティック回帰(より一般的にはGLM)は機械学習に属しませ!むしろ、これらの方法はパラメトリックモデリングに属します。

パラメトリックモデルとアルゴリズム(ML)モデルはどちらもデータを使用しますが、方法は異なります。アルゴリズムモデルは、予測子が予測子にどのようにマッピングされるかをデータから学習しますが、観測値を生成したプロセスに関する仮定は行いません(実際には他の仮定も行いません)。彼らは、入力変数と出力変数の間の基礎となる関係は複雑で不明であると考えているため、正式な方程式を課すのではなく、データ駆動型アプローチを採用して何が起こっているかを理解します。

一方、パラメトリックモデルは、検討するプロセスの知識に基づいてアプリオリに処方され、データを使用してパラメーターを推定し、実際にはほとんど保持されない非現実的な仮定(独立、等分散、エラーの正規分布)。

また、パラメトリックモデル(ロジスティック回帰など)はグローバルモデルです。データ内のローカルパターンをキャプチャすることはできません(ツリーをベースモデルとして使用するMLメソッドとは異なり、たとえばRFやBoosted Trees)。このペーパー 5ページを参照してください。修復戦略として、ローカル(つまり、ノンパラメトリック)GLMを使用できます(たとえば、locfit Rパッケージを参照)。

多くの場合、基礎となる現象に関する知識がほとんどない場合、データ駆動型のアプローチを採用し、アルゴリズムモデリングを使用することをお勧めします。たとえば、入力変数と出力変数の相互作用が線形でない場合にロジスティック回帰を使用すると、モデルは明らかに不適切になり、多くの信号がキャプチャされません。ただし、プロセスが十分に理解されている場合、パラメトリックモデルには、すべてを要約する公式の方程式を提供するという利点があり、これは理論的な観点から強力です。

より詳細な議論については、Leo Breimanによるこの素晴らしい論文を読んでください。


4
時間をかけてロジスティック回帰を理解してください。分布に関する仮定は一切行いません。MLによって行われたまったく同じ種類の独立性の仮定を行います。MLでは、ロジスティック回帰よりもはるかに大きなサンプルサイズが必要です。たとえば、ランダムフォレストとSVMでは候補機能ごとに200イベントが安定している必要がありますが、ロジスティック回帰では通常、候補変数ごとに200イベントが必要です。
フランクハレル

2
時間をかけてロジスティック回帰を理解する必要があります!これは、リンクがロジット関数である一般化線形モデルです。パラメトリックです。観測値がIIDであると想定しています。また、非線形の関係をキャプチャする幸運を。また、文の2番目の部分はどういう意味ですか?私にとって、機能とは変数(?)
Antoine

5
このテーマに関するたくさんの良い本がありますので、先に進む前にそれらを参照することをお勧めします。ロジスティック回帰は、同一の分布を想定しておらず、実際には全く分布を想定していない。MLで相関構造をどのように考慮するかを実証できない限り、両方のアプローチは独立性を前提としています。ロジスティック回帰の線形性の仮定を緩和するために、1982年以来回帰スプラインが使用されています。この説明では、スプラインで展開しない限り、feature = variableです。
フランクハレル

5
ブライマンは物事をよく理解していました。彼は、ペナルティ付き最尤推定、回帰スプライン、データ削減方法との組み合わせなど、ロジスティック回帰の1982年以降の開発には対処しませんでした。ロジスティック回帰の唯一の重大な制限は、他の方法と同様に、相互作用を検索し、それらが事前に指定されていない場合、適切な相互作用を見つけるのが得意ではないということです。これを行うことを目的とするほとんどの方法では、複製可能な結果は得られません。また、Breimanは不正なモデルで最適化できる不適切な精度スコアを使用しました。
フランクハレル

3
@Antoine:「ロジスティック回帰がMLと根本的に異なる理由」。MLの一部のメソッド(最も顕著なのはSVM)は、ロジスティック回帰に非常に関連していることに注意してください。Frankが書いたように、複数の相互作用を除いて、非線形性とペナルティを伴うロジスティックregは、SVMや他のMLメソッドと非常によく似た結果をもたらします。ロジスティック回帰をネガティブにフレーム化するために、MLメソッドとstat101ロジスティックモデルに基づいたパフォーマンスの改善を引用している論文がいくつかあります。
トーマスシュパイデル

-1

他の答えは、機械学習が何であるかを特定するのに良い仕事をしていると思います(彼らが示すように、それはファジーなものになる可能性があります)。ロジスティック回帰(およびより一般的な多項バージョン)は、人工ニューラルネットワークで分類を実行する手段として非常に一般的に使用されます(選択した賢明な機械学習定義によって明確にカバーされると思います)。ニューラルネットの人へのロジスティック回帰は、このコンテキストですぐに考えられるでしょう。機械学習でヘビーヒッターに縛られるのは、自分で機械学習手法になるための良い方法です。適切な機械学習手法であることを軽視することはできませんが、さまざまな回帰手法である程度は起こったと思います自分自身で。


ロジスティック回帰は分類子ではなく、直接確率推定法であることに注意してください。
フランクハレル

ハレル博士のポイントの詳細については、こちらの私の投稿をご覧ください。stats.stackexchange.com/questions/127042/...
Sycoraxが復活モニカ言う

@FrankHarrell分類の確率も使用できるため、実際には分類子です。
SmallChess

@ StudentT4それはこれ以上間違っていません。が直接確率推定器である場合。ロジスティックモデルの最終結果をどのように使用するかはユーザー次第です。ロジックでは、サンプルの平均は分類子です。
フランクハレル

-1

「反復的」な手順は、機械学習の場合と見なすことができると思います。回帰は機械学習と見なすことができます。手作業で行うこともできますが、可能な場合は時間がかかります。そのため、これらのプログラムであるマシンがあり、それらは私たちのために反復を行います。ソリューション、または最適なソリューションまたは最適なものにますます近づいています。したがって、「機械学習」。もちろん、ニューラルネットワークのようなものは、機械学習に関してほとんどの注目を集めているため、通常、これらのセクシーな手順に機械学習を関連付けます。また、「教師あり」機械学習と「教師なし」機械学習の違いはここで重要です


-2

それはほとんどの人がする非常に一般的な間違いであり、私はここでそれを見ることができます(ほとんどの人によって行われます)。詳しく説明しましょう... モデルのパラメーター(シータ)を推定するために使用している方法に依存します。線形回帰とロジスティックregでモデルパラメーターを見つけるには2つの方法があります。

  1. 勾配降下法:ここでは、ランダムな値をパラメーターに割り当て、コスト関数(エラー)を見つけることから始めます。各反復で、パラメーターを更新し、コスト関数を最小化します。一定回数の反復の後、コスト関数は目的の値に減少し、対応するパラメーター値が最終値になります。これは、機械学習技術が行うことになっていることです。そのため、勾配降下法を使用している場合、ロジスティック回帰は機械学習法として呼び出すことができます。

  2. 最小二乗法を使用する方法:ここでは、正規方程式として知られているパラメーターを見つけるための直接式があります(この式の導出を理解するには、いくつかの行列代数が必要です)。 最小二乗法

ここで、bはXが設計マトリックスであるパラメーターを表します。どちらの方法にも独自の利点と制限があります。詳細を取得するには、まだ実行中のコースラ機械学習コースに従ってください。

この投稿が参考になることを願っています.. :-)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.