回答:
教師あり学習問題は、同等の強化学習問題としてキャストできることは事実です。状態を入力データに対応させます。アクションを出力の予測に対応させます。教師あり学習に使用される損失関数のマイナスとして報酬を定義します。期待される報酬を最大化します。対照的に、強化学習の問題は通常、教師あり学習の問題として投げかけることはできません。したがって、この観点から、教師あり学習問題は強化学習問題のサブセットです。
しかし、一般的な強化学習アルゴリズムを使用して教師付き学習問題を解決しようとするのは、かなり無意味です。これは、問題を解決しやすくするための構造を破棄するだけです。強化学習では、教師あり学習とは関係のないさまざまな問題が発生します。また、教師あり学習は、一般的な強化学習設定には適用されないアプローチの恩恵を受けることができます。そのため、共通の基本原則と分野間で共有されるテクニックがありますが、通常、強化学習の一種として議論される教師あり学習は見られません。
参照資料
Barto and Dietterich(2004)。強化学習と教師あり学習との関係。