教師あり学習と教師なし学習の違いは何ですか?


28

クラスタリング方法を理解しようとしています。

私が理解したと思うII:

  1. 教師あり学習では、計算前に既知のカテゴリ/ラベルデータが割り当てられます。そのため、これらのクラスターにとって本当に重要なパラメーターを「学習」するために、ラベル、クラス、またはカテゴリーが使用されています。

  2. 教師なし学習では、クラスターを認識せずに、データセットがセグメントに割り当てられます。

つまり、どのパラメーターがセグメンテーションに重要であるかさえわからない場合、教師あり学習を好む必要があるということですか?


2
教師なし学習のタイプはクラスタリングだけではないことに注意してください。
ジョージ

1
ラベル付きトレーニングデータが利用可能な場合は、教師あり学習が推奨されます。監視ありまたは監視なしの方法を使用して、データをパーティション化できます。主な違いは、監視設定では、トレーニングデータの正しいセグメンテーションを知っていることです。
ニック

回答:


23

違いは、教師あり学習では、「カテゴリ」、「クラス」、または「ラベル」が知られていることです。教師なし学習ではそうではなく、学習プロセスは適切な「カテゴリー」を見つけようとします。どちらの種類の学習でも、すべてのパラメーターを考慮して、分類の実行に最適なパラメーターが決定されます。

監視ありまたは監視なしを選択したかどうかは、データの「カテゴリ」が何であるかを知っているかどうかに基づいている必要があります。知っている場合は、教師あり学習を使用してください。わからない場合は、監視なしを使用してください。

多数のパラメーターがあり、どのパラメーターが関連するかわからないため、主成分分析のようなものを使用して、関連するパラメーターを決定できます。


13

2度以上の監視があることに注意してください。たとえば、2007年の構造発見パラダイムにおける教師なしの知識なしの自然言語処理、Christian Biemannの博士論文の24〜25ページ(6〜7)を参照してください

学位論文では、自然言語処理のコンテキストで、4度(教師あり、半教師あり、弱教師あり、教師なし)を識別し、違いを説明します。関連する定義は次のとおりです。

  • 教師システム、機械学習アルゴリズムに提示されるデータは完全に標識されています。つまり、すべての例には、マシンが再現することを意図した分類が示されています。このために、データから分類子が学習され、まだ表示されていないインスタンスにラベルを割り当てるプロセスは分類と呼ばれます。
  • 半教師システム、マシンがさらに考慮非標識データを取得することができます。データベースが大きいため、半監視システムは、同じラベルの例を使用して、監視システムよりも優れていることがよくあります。この改善の理由は、ラベル付けされていないデータが増えると、システムがデータの固有の構造をより正確にモデル化できるようになるためです。
  • 自己訓練とも呼ばれるブートストラップは、さらに少ない訓練例を使用するように設計された学習形式であるため、弱教師付きと呼ばれることもありますます。ブートストラップは、いくつかのトレーニング例から始まり、分類器をトレーニングし、この分類器によって得られたと考えられるポジティブな例を再トレーニングに使用します。トレーニングサンプルのセットが大きくなると、分類器は改善されます。ただし、否定的なサンプルがポジティブと誤分類されない場合、パフォーマンスの低下につながる可能性があります。
  • 監視なしシステムには、トレーニング例は一切提供されず、クラスタリングを実施します。これは、データインスタンスをいくつかのグループに分割することです。クラスタリングアルゴリズムの結果はデー​​タ駆動型であるため、より「自然」であり、データの基になる構造により適しています。この利点は大きな欠点でもあります。マシンに何をすべきか(分類など)を伝える可能性がないと、決定的な方法でクラスタリング結果の品質を判断することが困難です。しかし、トレーニング例の準備がないため、教師なしパラダイムは非常に魅力的です。

0

教師あり学習では、クラスは事前に知られており、そのクラス、たとえば2つのクラスの良い顧客と悪い顧客も事前にわかっています。新しいオブジェクト(顧客)がその属性に基づいて来ると、顧客は悪い顧客クラスまたは良い顧客クラスに割り当てられます。

教師なし学習では、グループ/クラスはまだ知られていないため、オブジェクト(顧客)が存在するため、同様の購買習慣を持つ顧客をグループ化します。したがって、異なるグループは顧客で構成されます。


0

教師あり学習では、出力(従属変数)は入力変数(独立変数)に依存します。特定の監視のいくつかのセットでは、レスポンダーは目的を計算しようとします。

監視なし学習では、監視は行われないため、システムは状況に合わせて調整を試み、何らかの尺度に基づいて手動で学習します。

例:クラスの教師-監督-教師あり学習クラスで選択科目の自己学習-監督なし教師なし学習

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.