回答:
自己監視学習(または自己監視)は、比較的最近の(機械学習における)学習手法であり、トレーニングデータは自律的(または自動的)にラベル付けされます。それは依然として教師付き学習ですが、データセットは人間が手動でラベル付けする必要はありませんが、たとえば、異なる入力信号(つまり、異なるセンサーモダリティからの入力)間の関係(または相関)を見つけて活用することでラベル付けできます)。
自己監視学習の自然な利点と結果は、モデルを更新したり、モデルを更新したりできるオンラインの方法で(例えば、監視学習に関して)より簡単に実行できることです(ただし、人間の介入なしにデータを収集してラベルを付けることができます)。ゼロから完全に訓練。したがって、自己管理学習は、変化する環境、データ、一般的には状況にも適しているはずです。
たとえば、近接センサー(ロボットの前にある物体を近距離で検出できる短距離センサー)とカメラ(長距離センサーですが、オブジェクトを直接検出する方法)。このロボットが実行することができると仮定することもできますオドメトリます。そのようなロボットの例は、Mighty Thymioです。
次に、ロボットの前にある物体を、近接センサーの許容範囲よりも長い距離で検出するタスクを考えてみます。一般に、CNNをトレーニングしてそれを達成することができます。ただし、このようなCNNをトレーニングするには、教師あり学習で、最初にラベル付きの画像(またはビデオ)を含むラベル付きデータセットが必要です。ラベルは、「画像内のオブジェクト」や「画像内のオブジェクトなし」などです。教師あり学習では、このデータセットは人間が手動でラベル付けする必要があり、明らかに多くの作業が必要になります。
この問題を克服するために、私たちは自己管理学習アプローチを使用できます。この例では、基本的な考え方は、近接センサーの出力をタイムステップで関連付けることです。 タイムステップでのカメラの出力 (より小さなタイムステップ )。
より具体的には、ロボットが最初に座標にいると仮定します (平面上)、タイムステップ 。この時点では、まだカメラの出力にラベルを付けるための十分な情報がありません(同じ時間ステップで))。今、その時、、ロボットは位置にあります 。タイムステップで、近接センサーの出力は、例えば「ロボットの前のオブジェクト」または「ロボットの前のオブジェクトなし」になります。一般性を失うことなく、近接センサーの出力が 「ロボットの前にオブジェクトがない」の場合、カメラの出力(イメージフレーム)に関連付けられたラベル 「ロボットの前にはオブジェクトがありません」になります。
この特定の例の詳細については、Mirko Nava氏、JérômeGuzzi氏、R。Omar Chavez-Garcia氏、Luca M. Gambardella氏、Alessandro 氏による「短距離センサーとオドメトリからの自己監視を使用した長距離知覚の学習」を参照してください。ジュスティ。
自己監視学習の定義は、コンテキストや領域に応じて少し異なります。たとえば、ロボット工学、強化学習、表現(または特徴)学習などです。より正確には、上記の定義はロボット工学で使用されます。たとえば、このホワイトペーパー「マルチタスク自己教師付き視覚学習」も参照してください。自己監視学習のわずかに異なる定義については、たとえば、ペーパーDigging Into Self- supervised Monocular Depth Estimationを参照してください。
自己監視学習の別の紹介については、次のWeb記事をご覧ください。https://hackernoon.com/self-supervised-learning-gets-us-closer-to-autonomous-learning-be77e6c86b5a。この記事では、著者は自己教師あり学習を、教師なし学習、半教師あり学習、強化学習と比較しています。
さらに、自己監視学習に使用されている現在の方法を知りたい場合は、https://amitness.com/2020/02/illustrated-self-supervised-learningの記事をご覧ください。この記事では、著者は既存の自己管理メソッドの主要なアイデアを図と視覚化でまとめています。
この学習アプローチが使用されている論文へのリンクの厳選されたリストも次のURLにあります:https : //github.com/jason718/awesome-self-supervised-learning。
自己監視学習とは、サンプルの一部を、解決するために十分な理解が必要なタスクのラベルとして使用する場合です。例を示す前に、これらの2つの重要なポイントを強調します。
ラベルはサンプルから抽出されるため、非常に単純なアルゴリズム(おそらくランダム選択のみ)を使用して、ラベルを自動的に生成できます。
タスクには理解が必要です。これは、出力を予測するために、モデルはデータからいくつかの適切なパターンを抽出し、プロセス上で適切な表現を生成する必要があることを意味します。
半教師あり学習の非常に一般的なケースは、タスクを解決する必要があるがラベル付けされたデータがほとんどない場合に、自然言語処理で発生します。このような場合、適切な表現または言語モデルを学習する必要があるため、文章を取り、ネットワークに次のような自己監視タスクを与えます。
文に含まれる次の単語を予測するようにネットワークに依頼します(これは取り去ったため知っています)。
単語をマスクして、そこに行く単語を予測するようにネットワークに要求します(マスクする必要があったので、それを知っています)。
単語をランダムなものに変更し(おそらく意味がありません)、どの単語が間違っているかをネットワークに尋ねます。
ご覧のとおり、これらのタスクは非常に簡単に作成でき、ラベルは同じサンプルの一部ですが、解決するにはコンテキストをある程度理解する必要があります。
そして、それは常に次のようになります。データを何らかの方法で変更し、プロセスでラベルを生成し、モデルにその変換に関連するものを要求します。タスクでデータを十分に理解する必要がある場合は、成功します。