機械学習のコンテキストでは、次の違いは何ですか
- 教師なし学習
- 教師あり学習と
- 半教師あり学習?
そして、注目すべき主要なアルゴリズムのアプローチは何ですか?
機械学習のコンテキストでは、次の違いは何ですか
そして、注目すべき主要なアルゴリズムのアプローチは何ですか?
回答:
一般に、機械学習の問題は、分類、予測、またはモデリングのための関数推定のバリエーションと見なされる場合があります。
教師あり学習つが入力(備わっている、、...、)と出力(、、...、)と一般化方式でこの挙動を近似関数を求めるでチャレンジされます。出力は、クラスラベル(分類)または実数(回帰)である可能性があります。これらは、教師あり学習の「監督」です。
以下の場合は教師なし学習、基本ケースでは、あなたが入力受け取り、、...が、ターゲットの出力もその環境からの報酬も提供されません。問題(分類、または予測)とサンプリングされた空間の背景知識に基づいて、さまざまな方法を使用できます:密度推定(予測のための基礎となるPDFの推定)、k-meansクラスタリング(ラベルなしの実数値データの分類)、k-モードクラスタリング(ラベル付けされていないカテゴリデータの分類)など。
半教師あり学習は、ラベル付きデータとラベルなしデータの関数推定が含まれます。このアプローチは、ラベル付けされたデータの生成にコストがかかることが多いのに対し、ラベル付けされていないデータは通常そうではないという事実に基づいています。ここでの課題は、主に、この方法で混合されたデータをどのように扱うかという技術的な問題です。半教師あり学習方法の詳細については、この半教師あり学習に関する文献調査をご覧ください。
これらの種類の学習に加えて、強化学習など、学習メソッドがアクション、、…を生成することにより環境と相互作用する強化学習などがあります。。..報酬または罰、、...
教師付き/教師なしがそれについて考える最良の方法だとは思いません。基本的なデータマイニングの場合は、何をしようとしているのかを考える方が良いでしょう。4つの主なタスクがあります。
予測。実数を予測している場合、回帰と呼ばれます。整数またはクラスを予測する場合、分類と呼ばれます。
モデリング。モデリングは予測と同じですが、モデルは人間が理解できます。ニューラルネットワークとサポートベクターマシンはうまく機能しますが、わかりやすいモデルを作成しません[1]。決定木と古典的な線形回帰は、わかりやすいモデルの例です。
類似性。属性の自然なグループを見つけようとしている場合、それは因子分析と呼ばれます。観測の自然なグループを見つけようとしている場合、クラスタリングと呼ばれます。
協会。相関関係に非常に似ていますが、巨大なバイナリデータセット用です。
[1]どうやらゴールドマン・サックスは予測のために大量の素晴らしいニューラルネットワークを作成しましたが、誰も理解できなかったため、ニューラルネットワークを説明するために他のプログラムを作成する必要がありました。