教師あり学習
- 1)人間が入力データと出力データに基づいて分類器を構築する
- 2)その分類器はデータのトレーニングセットでトレーニングされます
- 3)その分類器はデータのテストセットでテストされます
- 4)出力が満足できる場合の展開
「このデータを分類する方法を知っているので、ソートするためにあなた(分類器)が必要なだけ」の場合に使用します。
メソッドのポイント:ラベルをクラス分けするか、実数を生成する
教師なし学習
- 1)人間は入力データに基づいてアルゴリズムを構築します
- 2)そのアルゴリズムは、データのテストセット(アルゴリズムが分類子を作成する)でテストされます。
- 3)分類子が満足できる場合の展開
「このデータを分類する方法がわからない場合、アルゴリズムを使用して分類子を作成できますか?」
方法のポイント:ラベルを分類する、または予測する(PDF)
強化学習
- 1)人間は入力データに基づいてアルゴリズムを構築します
- 2)そのアルゴリズムは、ユーザーがアルゴリズムが行ったアクションを介してアルゴリズムに報酬を与えるか罰する入力データに依存する状態を提示します。これは時間とともに継続します
- 3)そのアルゴリズムは報酬/罰から学び、それ自体を更新します、これは続きます
- 4)常に本番環境にあり、州からのアクションを提示できるように実際のデータを学習する必要があります
「このデータを分類する方法がわかりません。このデータを分類してもらえますか。それが正しい場合は報酬を、そうでない場合は罰します。」
これはこれらのプラクティスの種類の流れですか、彼らが何をするかについて多くを聞きますが、実用的で模範的な情報は驚くほど少ないです!