教師なし学習、教師あり学習、半教師あり学習


27

機械学習のコンテキストでは、次の違いは何ですか

  • 教師なし学習
  • 教師あり学習と
  • 半教師あり学習?

そして、注目すべき主要なアルゴリズムのアプローチは何ですか?


8
まず、Wikiからの2行:「コンピューターサイエンスでは、半教師あり学習はラベル付きデータとラベルなしデータの両方をトレーニングに使用する機械学習手法のクラスです。通常、少量のラベル付きデータと大量のラベルなしデータです。半教師あり学習は、教師なし学習(ラベル付きトレーニングデータなし)と教師あり学習(完全なラベル付きトレーニングデータ付き)の間にあります。」それは役立ちますか?

「アルゴリズム的アプローチ」について何を念頭に置いていますか?私の答えでアプリケーションの例をいくつか挙げましたが、あなたが探しているものは何ですか?
ピータースミット

回答:


20

一般に、機械学習の問題は、分類、予測、またはモデリングのための関数推定のバリエーションと見なされる場合があります。

教師あり学習つが入力(備わっているx1x2、...、)と出力(y1y2、...、)と一般化方式でこの挙動を近似関数を求めるでチャレンジされます。出力は、クラスラベル(分類)または実数(回帰)である可能性があります。これらは、教師あり学習の「監督」です。

以下の場合は教師なし学習、基本ケースでは、あなたが入力受け取りx1x2、...が、ターゲットの出力もその環境からの報酬も提供されません。問題(分類、または予測)とサンプリングされた空間の背景知識に基づいて、さまざまな方法を使用できます:密度推定(予測のための基礎となるPDFの推定)、k-meansクラスタリング(ラベルなしの実数値データの分類)、k-モードクラスタリング(ラベル付けされていないカテゴリデータの分類)など。

半教師あり学習は、ラベル付きデータとラベルなしデータの関数推定が含まれます。このアプローチは、ラベル付けされたデータの生成にコストがかかることが多いのに対し、ラベル付けされていないデータは通常そうではないという事実に基づいています。ここでの課題は、主に、この方法で混合されたデータをどのように扱うかという技術的な問題です。半教師あり学習方法の詳細については、この教師あり学習に関する文献調査をご覧ください。

これらの種類の学習に加えて、強化学習など、学習メソッドがアクションa1a2、…を生成することにより環境と相互作用する強化学習などがあります。。..報酬または罰r1r2、...


1
あなたの答えは、可能であれば、教師あり学習が半教師あり学習よりも望ましいことを意味します。あれは正しいですか?そうでない場合、半教師あり学習はいつ改善されるでしょうか?
naught101

@ naught101彼の答えからそれをどのように読みますか?ジョンの言うことには同意しますが、あなたの言うことの反対、つまり、可能な限り教師あり学習よりも半教師あり学習の方が望ましいと言えます。つまり、ラベル付きデータとラベルなしデータ(通常はラベル付きデータの量よりもはるかに多い)がある場合、すべてのデータを使用できる場合は、ラベル付きデータのみを使用できる場合よりも優れています。半教師あり学習を使用する最大の目的は、教師あり学習または教師なし学習のいずれかを実行することで得られるパフォーマンスを上回ることです。
HelloGoodbye

@HelloGoodbye:半教師付き学習に指定されている唯一の利点は、場合によっては安価ですが、より挑戦的であるという追加の欠点があります。より多くのグラウンドトゥルースデータが提供されることを考えると、完全に監督された学習がより簡単で、より正確になる(他のすべてが等しい)ことは私にとって理にかなっています。ですから、2つの選択肢を考えると、半教師付きの方が好ましい例がありました。あなたのコメントは理にかなっていますが、すべてのデータにラベルが付けられていて、まだ半監視を好む場合がありますか?
naught101

@ naught101すべてのデータにラベルが付けられている場合、通常の教師あり学習を使用する代わりに、半教師あり学習を使用してもあまり勝てません。ラベルのないデータが多く、半教師あり学習を行う場合、パフォーマンスが向上する主な理由は、転送学習を行い、ラベルのないデータからも経験を引き出すことができるためです。
HelloGoodbye

@ naught101ただし、ネットワークに出力データから可能な限り入力データを再現するタスクを与える(つまり、教師なし学習の一種であるオートエンコーダーを実装する)ことにより、ネットワークはデータの適切な表現を学習せざるを得ません。これは一種の正則化として機能する可能性があり、これもまた有益であることがわかります。そのため、すべてのデータにラベルが付けられている場合でも、通常の教師あり学習の代わりに半教師あり学習を使用することで、わずかなメリットが得られる可能性があります。ただし、この効果の大きさはわかりません。
HelloGoodbye

13

教師なし学習

教師なし学習とは、トレーニングに使用できるラベル付きデータがない場合です。この例は、多くの場合、クラスタリング手法です。

教師あり学習

この場合、ラベル付けされたデータからトレーニングデータが存在します。ここで解決する問題は、多くの場合、ラベルなしのデータポイントのラベルを予測することです。

半教師あり学習

この場合、ラベル付きデータとラベルなしデータの両方が使用されます。これは、たとえば、一部の層がデータの構造を学習し(教師なし)、1つの層を使用して分類を行う(教師ありデータでトレーニングされた)深い信念ネットワークで使用できます。


7

教師付き/教師なしがそれについて考える最良の方法だとは思いません。基本的なデータマイニングの場合は、何をしようとしているのかを考える方が良いでしょう。4つの主なタスクがあります。

  1. 予測。実数を予測している場合、回帰と呼ばれます。整数またはクラスを予測する場合、分類と呼ばれます。

  2. モデリング。モデリングは予測と同じですが、モデルは人間が理解できます。ニューラルネットワークとサポートベクターマシンはうまく機能しますが、わかりやすいモデルを作成しません[1]。決定木と古典的な線形回帰は、わかりやすいモデルの例です。

  3. 類似性。属性の自然なグループを見つけようとしている場合、それは因子分析と呼ばれます。観測の自然なグループを見つけようとしている場合、クラスタリングと呼ばれます。

  4. 協会。相関関係に非常に似ていますが、巨大なバイナリデータセット用です。

[1]どうやらゴールドマン・サックスは予測のために大量の素晴らしいニューラルネットワークを作成しましたが、誰も理解できなかったため、ニューラルネットワークを説明するために他のプログラムを作成する必要がありました。


GSストーリーに関する詳細情報を提供できますか?(なぜあなたのコメントに直接コメントできないのか分かりません)
YA

どこで読んだのか正確には思い出せませんが、AI @ GSの詳細を以下に示し
ニール

私は、1、2は監視された環境での学習を説明し、3、4は監視されていない環境にあると感じています。また、予測のために類似性を探すとどうなりますか?それはモデリングと見なされますか?
チョルダー氏
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.