回答:
この非常に基本的な質問をするので、機械学習自体を特定する価値があるように見えます。
機械学習は、データ駆動型のアルゴリズムのクラスです。つまり、「通常の」アルゴリズムとは異なり、「良い答え」が何であるかを「伝える」のはデータです。例:画像内の顔検出の架空の非機械学習アルゴリズムは、顔が何であるかを定義しようとします(丸い肌のような色のディスク、目が期待される暗い領域など)。機械学習アルゴリズムでは、このようなコード化された定義はありませんが、「例によって学習」されます。顔と顔以外の画像がいくつか表示され、優れたアルゴリズムは最終的に学習し、目に見えないかどうかを予測できます画像は顔です。
この顔検出の特定の例は監視されています。つまり、例にラベルを付けるか、どの顔が顔でどの顔がそうでないかを明示する必要があります。
で教師なしあなたの例がされていないアルゴリズムラベルされた、あなたは何も言うことはありませんつまり。もちろん、そのような場合、アルゴリズム自体は顔を「発明」することはできませんが、データをさまざまなグループにクラスター化しようとすることができます。
別の回答がそれについて言及しているため(ただし、誤った方法で)、「中間」形式の監視、つまり半監視および能動学習があります。技術的には、これらは監視された方法であり、ラベル付きの多数の例を回避するための「スマート」な方法がいくつかあります。アクティブな学習では、アルゴリズム自体がラベル付けする必要があるものを決定します(たとえば、風景や馬についてはかなり確実ですが、ゴリラが本当に顔の写真であるかどうかを確認するように求められる場合があります)。半教師あり学習では、2つの異なるアルゴリズムがあり、ラベル付きの例から始まり、いくつかのラベルなしデータについての考え方を互いに「伝え」ます。この「議論」から彼らは学びます。
トレーニングデータが入力ベクトルの例とそれに対応するターゲットベクトルの例を含むアプリケーションは、教師あり学習問題として知られています。
他のパターン認識問題では、トレーニングデータは、対応するターゲット値のない入力ベクトルxのセットで構成されます。このような教師なし学習問題の目標は、データ内で類似した例のグループを発見することであり、クラスタリングと呼ばれます。
パターン認識と機械学習(Bishop、2006)
教師あり学習では、入力x
に期待される結果y
(つまり、入力がのときにモデルが生成するはずの出力)が提供されx
ますx
。これは、対応する入力の「クラス」(または「ラベル」)と呼ばれることがよくあります。
教師なし学習では、例の「クラス」はx
提供されません。したがって、教師なし学習は、ラベルのないデータセットで「隠された構造」を見つけることと考えることができます。
教師あり学習へのアプローチは次のとおりです。
分類(1R、単純ベイズ、ID3 CARTなどの決定木学習アルゴリズムなど)
数値予測
教師なし学習へのアプローチは次のとおりです。
クラスタリング(K平均、階層的クラスタリング)
相関ルール学習
たとえば、多くの場合、ニューラルネットワークのトレーニングは教師あり学習です。つまり、供給している特徴ベクトルに対応するクラスをネットワークに伝えます。
クラスタリングは教師なし学習です。共通のプロパティを共有するクラスにサンプルをグループ化する方法をアルゴリズムに決定させます。
教師なし学習のもう1つの例は、Kohonenの自己組織化マップです。
例を挙げましょう。
どの車両が車で、どの車両がオートバイであるかを認識する必要があるとします。
で教師それは車やオートバイを表す場合の学習の場合、ある標識するためにあなたの入力(トレーニング)データセットのニーズ、あなたの入力(トレーニング)データセット内の各入力要素のために、あなたは指定する必要があります。
で教師なし学習の場合、あなたは入力にラベルを付けないでください。教師なしモデルは、たとえば類似の機能/プロパティに基づいて、入力をクラスターにクラスター化します。したがって、この場合、「車」のようなラベルはありません。
教師あり学習
教師あり学習は、正しい分類が既に割り当てられているデータソースからのデータサンプルのトレーニングに基づいています。このような手法は、フィードフォワードモデルまたはマルチレイヤーパーセプトロン(MLP)モデルで使用されます。これらのMLPには、3つの特徴があります。
これらの特性とトレーニングによる学習は、困難で多様な問題を解決します。監視付きANNモデルでのトレーニングによる学習は、エラー逆伝播アルゴリズムとも呼ばれます。エラー修正学習アルゴリズムは、入出力サンプルに基づいてネットワークをトレーニングし、計算された出力と目的の出力の差であるエラー信号を見つけ、エラーの積に比例するニューロンのシナプスの重みを調整します信号とシナプスの重みの入力インスタンス。この原理に基づいて、エラーの逆伝播学習は2つのパスで発生します。
フォワードパス:
ここでは、入力ベクトルがネットワークに提示されます。この入力信号は、ニューロンを介してネットワークを介して前方に伝播し、ネットワークの出力端に出力信号として現れます。y(n) = φ(v(n))
ここで、v(n)
は、によって定義されるニューロンの誘導されたローカルフィールドv(n) =Σ w(n)y(n).
です。望ましい応答と比較してd(n)
とe(n)
そのニューロンのエラーを見つけます。このパス中のネットワークのシナプスの重みは同じままです。
後方パス:
その層の出力ニューロンで発生したエラー信号は、ネットワークを介して後方に伝播されます。これにより、各層の各ニューロンのローカルグラディエントが計算され、ネットワークのシナプスの重みがデルタルールに従って次のように変更されます。
Δw(n) = η * δ(n) * y(n).
この再帰的な計算は継続され、ネットワークが収束するまで、各入力パターンのフォワードパスとそれに続くバックワードパスが続きます。
ANNの教師あり学習パラダイムは効率的であり、分類、プラント制御、予測、予測、ロボット工学などのいくつかの線形および非線形問題の解決策を見つけます。
教師なし学習
自己組織化ニューラルネットワークは、教師なし学習アルゴリズムを使用して学習し、ラベルのない入力データの隠れたパターンを識別します。この教師なしとは、潜在的なソリューションを評価するためのエラー信号を提供せずに情報を学習および整理する機能を指します。教師なし学習における学習アルゴリズムの方向性の欠如は、以前に考慮されていなかったパターンをアルゴリズムが振り返ることができるため、有利な場合があります。自己組織化マップ(SOM)の主な特徴は次のとおりです。
計算層は、層内のニューロンが互いに競合してアクティブになるため、競合層とも呼ばれます。したがって、この学習アルゴリズムは競合アルゴリズムと呼ばれます。SOMの教師なしアルゴリズムは、3つのフェーズで機能します。
競争フェーズ:
x
ネットワークに提示される各入力パターンについて、シナプスの重みを持つ内積w
が計算され、競合層のニューロンがニューロン間の競合を誘発する判別関数とユークリッド距離の入力ベクトルに近いシナプスの重みベクトルを見つけますコンテストの勝者として発表されます。そのニューロンは、最も一致するニューロンと呼ばれ、
i.e. x = arg min ║x - w║.
協力フェーズ:
勝ったニューロンh
は、協調するニューロンのトポロジカルな近傍の中心を決定します。これはd
、協調ニューロン間の側方相互作用によって実行されます。このトポロジー的な近傍は、一定期間にわたってそのサイズを縮小します。
適応フェーズ:
勝ったニューロンとその近傍ニューロンが、適切なシナプスの重みの調整を通じて、入力パターンに関連する判別関数の個々の値を増加できるようにします。
Δw = ηh(x)(x –w).
トレーニングパターンを繰り返し提示すると、シナプスの重みベクトルは、近傍の更新により入力パターンの分布に従う傾向があり、したがって、ANNはスーパーバイザなしで学習します。
自己組織化モデルは自然に神経生物学的挙動を表すため、クラスタリング、音声認識、テクスチャセグメンテーション、ベクトルコーディングなど、多くの現実世界のアプリケーションで使用されます。
私は常に、教師なし学習と教師付き学習の違いが恣意的で少し混乱していることに気づきました。2つのケースの間に実際の違いはありませんが、アルゴリズムが多かれ少なかれ「監視」を持つことができる状況の範囲があります。半教師あり学習の存在は、線がぼやけている明らかな例です。
私は監督を、どのソリューションを優先すべきかについてアルゴリズムにフィードバックを与えると考えがちです。スパム検出などの従来の監視対象設定では、アルゴリズムに「トレーニングセットでミスをしないでください」と伝えます。クラスタリングなどの従来の監視されていない設定では、アルゴリズムに「互いに近い点は同じクラスター内にある必要がある」と伝えます。偶然にも、最初のフィードバックの形式は後者よりもはるかに具体的です。
つまり、誰かが「監視あり」と言うときは分類を考え、「監視なし」と言うときはクラスタリングを考えて、それ以上はあまり気にしないようにしてください。
機械学習:データ から学習して予測を行うことができるアルゴリズムの研究と構築を探求します。このようなアルゴリズムは、厳密に静的ではなく、データ駆動型の予測または出力として表現される決定を行うために、入力例からモデルを構築することによって機能します。プログラムの指示。
教師あり学習: これは、ラベル付けされたトレーニングデータから関数を推測する機械学習タスクです。トレーニングデータは、一連のトレーニング例で構成されています。教師あり学習では、各例は、入力オブジェクト(通常はベクトル)と目的の出力値(監視信号とも呼ばれます)で構成されるペアです。教師あり学習アルゴリズムは、トレーニングデータを分析し、推論された関数を生成します。これは、新しい例のマッピングに使用できます。
コンピュータには、「教師」によって与えられた入力例とその望ましい出力が提示され、目標は、入力を出力にマッピングする一般的なルールを学ぶことです。具体的には、教師あり学習アルゴリズムは、既知の入力データと既知の応答のセットを取ります新しいデータへの応答の合理的な予測を生成するようにモデルをトレーニングします。
教師なし学習:教師のい ない学習です。データで実行したい基本的なことの1つは、データを視覚化することです。これは、ラベルのないデータから隠れた構造を記述する関数を推測する機械学習タスクです。学習者に与えられた例にはラベルが付いていないため、潜在的な解決策を評価するためのエラーや報酬の信号はありません。これにより、教師なし学習と教師あり学習が区別されます。教師なし学習では、パターンの自然な分割を見つけようとする手順を使用します。
教師なし学習の場合、予測結果に基づくフィードバックはありません。つまり、教師が修正する必要はありません。教師なし学習の方法では、ラベル付きの例は提供されず、学習プロセス中の出力の概念はありません。その結果、パターンを見つけたり、入力データのグループを発見したりするのは、学習スキーム/モデル次第です。
モデルをトレーニングするために大量のデータが必要であり、実験と探索の意欲と能力が必要な場合、そしてもちろん、確立された方法では十分に解決されない課題である場合は、教師なし学習方法を使用する必要があります。教師あり学習よりも大きく複雑なモデルを学習できます。ここにその良い例があります
。
教師あり学習:子供が幼稚園に行くとしましょう。ここで先生は彼に3つのおもちゃの家、ボール、車を見せます。今、先生は彼に10個のおもちゃをあげます。以前の経験に基づいて、家、ボール、車の3つのボックスに分類します。そのため、子供は最初、いくつかのセットについて正しい答えを得るために教師によって監督されました。それから彼は未知のおもちゃでテストされました。
教師なし学習:再び幼稚園の例。子供には10個のおもちゃが与えられます。彼は同様のものをセグメント化するように言われています。形状、サイズ、色、機能などの機能に基づいて、A、B、Cの3つのグループを作成してグループ化しようとします。
Superviseという言葉は、答えを見つけるために機械に監督/指示を与えていることを意味します。命令を学習すると、新しいケースを簡単に予測できます。
監視なしとは、回答やラベルを見つける方法や指示がないことを意味します。マシンはそのインテリジェンスを使用してデータ内のパターンを検索します。ここでは、予測は行われません。同様のデータを持つクラスターを見つけようとします。
違いを詳細に説明する答えはすでにたくさんあります。codeacademyでこれらのgifを見つけました。それらのgif はしばしば違いを効果的に説明するのに役立ちます。
トレーニング画像にはここにラベルがあり、モデルは画像の名前を学習していることに注意してください。
ここで行われているのは単なるグループ化(クラスタリング)であり、モデルは画像について何も認識していないことに注意してください。
回答付きのデータが与えられた教師あり学習。
迷惑メール/迷惑メールではないというラベルの付いたメールがある場合、迷惑メールフィルタについて学びます。
糖尿病があるかどうかが診断された患者のデータセットを前提として、新しい患者を糖尿病があるかどうかを分類する方法を学びます。
教師なし学習では、答えのないデータが与えられた場合、PCでグループ化してみましょう。
ウェブ上で見つかった一連のニュース記事を前提として、同じストーリーに関する記事のセットにグループ化します。
カスタムデータのデータベースが与えられると、市場セグメントを自動的に検出し、顧客をさまざまな市場セグメントにグループ化します。
教師あり学習
この場合、ネットワークのトレーニングに使用されるすべての入力パターンは、ターゲットまたは目的のパターンである出力パターンに関連付けられます。エラーを決定するために、ネットワークの計算された出力と予想される正しい出力を比較するとき、教師は学習プロセス中に存在すると想定されます。次に、エラーを使用してネットワークパラメータを変更できます。これにより、パフォーマンスが向上します。
教師なし学習
この学習方法では、ターゲット出力はネットワークに提示されません。それはあたかも希望のパターンを提示する教師がいないかのようであり、したがってシステムは入力パターンの構造的特徴を発見してそれに適応することによってそれ自体を学習します。
シンプルに保つようにします。
教師あり学習:この学習手法では、データセットが与えられ、システムはデータセットの正しい出力をすでに認識しています。したがって、ここでは、システムは独自の値を予測して学習します。次に、コスト関数を使用して精度をチェックし、予測が実際の出力にどれだけ近いかをチェックします。
教師なし学習:このアプローチでは、結果がどうなるかについてほとんどまたはまったく知識がありません。したがって、代わりに、変数の影響がわからないデータから構造を導き出します。データ内の変数間の関係に基づいてデータをクラスタリングすることで構造を作成します。ここでは、予測に基づくフィードバックはありません。
入力xとターゲット出力tがあります。したがって、不足している部分を一般化するようにアルゴリズムをトレーニングします。対象が与えられているので監視されています。あなたは、アルゴリズムを伝える監督者です。例xの場合、t!
通常、セグメンテーション、クラスタリング、および圧縮はこの方向にカウントされますが、それを適切に定義するのに苦労します。
例として、圧縮用の自動エンコーダーを取り上げましょう。入力xしか与えられていないが、ターゲットもxであることをアルゴリズムに伝えるのは人間のエンジニアです。したがって、ある意味では、これは教師あり学習と同じです。
また、クラスタリングとセグメンテーションについては、それが機械学習の定義に本当に当てはまるかどうかもわかりません(他の質問を参照)。
教師あり学習では、トレーニング中の学習に基づいて、トレーニング済みのラベルの1つに新しいアイテムをラベル付けできます。多数のトレーニングデータセット、検証データセット、およびテストデータセットを提供する必要があります。数字の言うピクセルイメージベクトルとラベル付きのトレーニングデータを提供すると、数値を識別できます。
教師なし学習では、トレーニングデータセットは必要ありません。教師なし学習では、入力ベクトルの違いに基づいてアイテムを異なるクラスターにグループ化できます。数字のピクセル画像ベクトルを提供し、それを10のカテゴリに分類するように依頼すると、それが可能になります。ただし、トレーニングラベルを提供していないため、ラベルを付ける方法はわかっています。
教師あり学習では、基本的に、入力変数(x)と出力変数(y)があり、アルゴリズムを使用して入力から出力へのマッピング関数を学習します。これを教師ありと呼んだ理由は、アルゴリズムがトレーニングデータセットから学習し、アルゴリズムがトレーニングデータを繰り返し予測するためです。監視ありには、分類と回帰の2つのタイプがあります。分類は、出力変数がyes / no、true / falseのようなカテゴリである場合です。回帰は、出力が人の身長、温度などの実際の値である場合です。
UN教師あり学習では、入力データ(X)のみがあり、出力変数はありません。上記の教師あり学習とは異なり、正しい答えはなく、教師もいないため、これは教師なし学習と呼ばれます。アルゴリズムは、データ内の興味深い構造を発見して提示するための独自の工夫に任されています。
教師なし学習のタイプは、クラスタリングと関連付けです。
教師あり学習は、基本的に、マシンが学習するトレーニングデータにすでにラベルが付けられている手法であり、トレーニング中にデータをすでに分類している単純な偶数奇数分類器を想定しています。したがって、「LABELLED」データを使用します。
逆に教師なし学習は、マシン自体がデータにラベルを付ける手法です。または、マシンが最初から学習する場合も同様です。
単純な 教師あり学習は、いくつかのラベルがあり、そのラベルを使用して回帰や分類などのアルゴリズムを実装する機械学習問題の一種です。はい・いいえ。そして、価格の家のような本当の価値を出すところに回帰が適用されます
教師なし学習は、機械学習問題の一種であり、ラベルがないため、一部のデータのみ、非構造化データがあり、さまざまな教師なしアルゴリズムを使用してデータをクラスター化(データのグループ化)する必要があります
教師あり機械学習
「トレーニングデータセットから学習して出力を予測するアルゴリズムのプロセス。」
トレーニングデータ(長さ)に正比例する予測出力の精度
教師あり学習では、入力変数(x)(トレーニングデータセット)と出力変数(Y)(テストデータセット)があり、アルゴリズムを使用して入力から出力へのマッピング関数を学習します。
Y = f(X)
主なタイプ:
アルゴリズム:
分類アルゴリズム:
Neural Networks
Naïve Bayes classifiers
Fisher linear discriminant
KNN
Decision Tree
Super Vector Machines
予測アルゴリズム:
Nearest neighbor
Linear Regression,Multi Regression
応用分野:
音声認識
人事部が特定の候補者を選択するかどうかを予測する
株式市場の価格を予測する
教師あり学習:
教師あり学習アルゴリズムは、トレーニングデータを分析し、新しい例をマッピングするために使用できる推定関数を生成します。
問題のカテゴリー:
回帰: 連続出力内の結果を予測=>入力変数をいくつかの連続関数にマップします。
例:
人の写真を与えられ、彼の年齢を予測します
分類:結果を離散出力に予測=>入力変数を離散カテゴリにマッピング
例:
この腫瘍は癌性ですか?
教師なし学習:
教師なし学習は、ラベル付け、分類、または分類されていないテストデータから学習します。教師なし学習は、データ内の共通点を識別し、新しいデータの各部分におけるそのような共通点の有無に基づいて対応します。
データ内の変数間の関係に基づいてデータをクラスタリングすることにより、この構造を導出できます。
予測結果に基づくフィードバックはありません。
問題のカテゴリー:
クラスタリング:同じグループ(クラスターと呼ばれる)内のオブジェクトが他のグループ(クラスター)内のオブジェクトよりも(ある程度の意味で)互いに類似するようにオブジェクトのセットをグループ化するタスクです。
例:
1,000,000個の異なる遺伝子のコレクションを取り、これらの遺伝子を、寿命、場所、役割などのさまざまな変数によって何らかの形で類似または関連するグループに自動的にグループ化する方法を見つけます。
人気のあるユースケースはここにリストされています。
参照:
教師あり学習
教師なし学習
例:
教師あり学習:
オレンジ入りバッグ
=>モデルの構築
リンゴとオレンジの混合袋。
=>分類してください
教師なし学習:
リンゴとオレンジの混合袋。
=>モデルの構築
別の混合バッグ
=>分類してください
教師あり学習
教師あり学習は、生の入力の出力を知っている場所です。つまり、機械学習モデルのトレーニング中に、与えられた出力で何を検出する必要があるかを理解し、トレーニング中にシステムを導くようにデータにラベルが付けられますそれに基づいて事前にラベル付けされたオブジェクトを検出します。これは、トレーニングで提供した同様のオブジェクトを検出します。
ここで、アルゴリズムはデータの構造とパターンが何であるかを認識します。教師あり学習は分類に使用されます
例として、正方形、円形、三角形の形状の異なるオブジェクトを作成できます。ラベル付きのデータセットに同じタイプの形状を配置し、すべての形状にラベルを付けます。そのデータセットで機械学習モデルをトレーニングします。トレーニングデータセットに基づいて、形状の検出を開始します。
教師なし学習
教師なし学習は、最終結果がわからない無誘導学習であり、データセットをクラスター化し、オブジェクトの同様のプロパティに基づいて、オブジェクトを異なるバンチに分割し、オブジェクトを検出します。
ここでアルゴリズムは生データの異なるパターンを検索し、それに基づいてデータをクラスター化します。教師なし学習は、クラスタリングに使用されます。
例として、正方形、円形、三角形の複数の形状の異なるオブジェクトを持つことができるため、オブジェクトのプロパティに基づいて房を作成します。オブジェクトに4つの側面がある場合は正方形と見なし、3つの側面がある場合は三角形と円以外の辺がない場合、ここではデータにラベルが付けられていません。さまざまな形状を検出するように学習します
機械学習は、人間の行動を模倣する機械を作成しようとしている分野です。
赤ちゃんのように機械をトレーニングします。人間が学習し、機能を識別し、パターンを認識し、自分でトレーニングする方法は、さまざまな機能を備えたデータをフィードして機械をトレーニングする方法と同じです。マシンアルゴリズムは、データ内のパターンを識別し、それを特定のカテゴリに分類します。
機械学習は、教師あり学習と教師なし学習の2つのカテゴリに大別されます。
教師あり学習は、対応するターゲット値(出力)を持つ入力ベクトル/データがあるという概念ですが、教師なし学習は、対応するターゲット値がない入力ベクトル/データのみがあるという概念です。
教師あり学習の例は、対応する数字[0-9]を持つ数字の画像がある手書き数字認識であり、教師なし学習の例は、購入行動によって顧客をグループ化することです。