タグ付けされた質問 「reinforcement-learning」

2
強化学習を使用したロボットに続くラインのプログラミング
強化学習アルゴリズムを使用して、ロボットに続くラインをプログラミングすることを検討しています。私が熟考している質問は、どのようにアルゴリズムを取得して、任意のパスをナビゲートすることを学ぶことができますか? 強化学習のためにサットン&バルトブックをたどり、競馬場での運動の問題を解決しました。そこでは、車のエージェントがコースから出て速度を調整しないことを学びました。しかし、その運動の問題により、エージェントは訓練を受けたトラックをナビゲートする方法を学ぶことができました。 ロボットに任意の経路をナビゲートさせることは強化学習の範囲内ですか?エージェントはレースサーキットまたはパスのマップを絶対に持っている必要がありますか?状態空間にどのようなパラメーターを使用できますか?

2
ロボットをモデル化するにはどうすればよいですか?
強化学習技術を使ったライン追従ロボットの訓練についての質問に答えて、ロボットの訓練方法を考えさせられました。私は本質的に2つの方法があると信じています- 物理ロボットを訓練する。 ロボットをモデル化し、トレーニングをシミュレートします。 私は何か見落としてますか? アプローチ2は間違いなく優れたアプローチです。ただし、モーション(応答)の事前の知識は、ロボットが特定の状態にあるときに特定のPWM信号(刺激)が発生することを必要とします。PWM信号によって引き起こされる動きは、(1)現在のバッテリー電圧、(2)ロボットの質量、および(3)現在の速度(何か見落としましたか?)によって異なります。 このようなロボットをモデル化するにはどうすればよいですか?そして、それをどのようにすばやくモデル化するのですか?バッテリーを交換したり、ボードやその他の周辺機器を追加してロボットの質量を変更したりすると、ロボットを改造して再トレーニングする必要があります。ランダムな刺激PWMをいくつか提供し、応答を測定することで、これを実行できますか? 追加:dsp.SEでの私の関連質問 更新:言及する価値のあるIanによるタイトルへの提案された編集-「ダイナミクスが変化した場合、完全な再トレーニングが必要ないようにロボットをモデル化するにはどうすればよいですか?」これも良い質問だと思いますが、ここで私が尋ねているもの。とりあえず再トレーニングで大丈夫です。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.