ハミルトン-ヤコビ-ベルマン方程式の解法; 最適化に必要かつ十分ですか?


13

以下の微分方程式検討 xは状態であり、U制御変数。溶液は次式で与えられる X T = X 0 + T 0 F X 複数可U S D S ここでx

x˙(t)=f(x(t),u(t))
xu
x(t)=x0+0tf(x(s),u(s))ds.
x0:=x(0)は与えられた初期状態です。

次のプログラムを検討してください

V(x0):=maxu0eρtF(x(t),u(t))dts.t. x˙(t)=f(x(t),u(t))x(0)=x0
ρ>0V()F()
ρV(x)=maxu[F(x,u)+V(x)f(x,u)],t[0,).

のHJBを解いたとしましょう。最適な制御は、与えられ 状態と制御最適な軌道を取得します。V

u=argmaxu[F(x,u)+V(x)f(x,u)].
{(x(t),u(t)):t[0,)}

ウィキ記事は述べています

...しかし、状態空間全体にわたって解かれた場合、HJB方程式は最適な条件に必要かつ十分な条件です。

Bertsekas(2005)Dynamic Programming and Optimal Control、Vol 1、3rd ed。、Proposition 3.2.1では、Vの解法Vは最適なコストツーゴー関数であり、関連するuが最適であると述べています。しかし、彼はそれを十分性定理として明示的に宣言しています。

実際、HJBを解決し、関連する状態と制御の軌道を回復した場合、追加の最適化条件を気にする必要がないことを確認したいだけです。

解決

私は試みます

HJB方程式自体により、最大原理から必要な条件を導き出すことができたと思います。

ハミルトニアンを定義する

H(x,u,V(x)):=F(x,u)+V(x)f(x,u)

その後、我々は

ρV(x)=maxuH(x,u,V(x))

これは

ρV(x)=H(x,u,V(x)).

任意の関数q:[0,)Rq(0)= \ lim_ {t \ to \ infty} q(t)= 0で定義しますq(0)=limtq(t)=0\ begin {align} x = x ^ * + \ varepsilon q \ end {align}を修正

x=x+εq

ここで、はパラメーターです。得られる最大化ハミルトニアンに用語を接続 ρ V X * + ε Q = H X * + ε Q U *V 'X * + ε Q εR

ρV(x+εq)=H(x+εq,u,V(x+εq)).

では、最適な解が得られます。したがって、を微分して、1次条件 ε=0ε

ρVq=Hxq+HVVq.

ここで、随伴変数を定義します

λ=V(x).

経時微分

λ˙=Vx˙.

であることに注意してください

HV=f(x,u)=x˙.

すべてをプラグインに接続すると、

ρλ=Hx+λ˙.

それはほとんどそれです。HJBを解くことは、最適化のために実際に必要かつ十分です(ここでは省略)。誰かがウィキに追加する必要があります。そのような問題について考えている人々の時間を節約するかもしれません(私は多くのことを考慮しません)。

ただし、横断条件 はありません。

limteρtλ(t)=0

IIの試み

ペイオフ機能を定義する

J(u):=0eρtF(x,u)dt

なお の定義によって。中立の用語をペイオフ機能に追加します

0eρtλ[f(x,u)x˙]dt=0
x˙=f(x,u)
J(u)=0eρt[F(x,u)+λf(x,u)]dt0eρtλx˙dt=0eρtH(x,u,λ)0eρtλx˙dt

正しい用語の一部とrhsの統合により、

0eρtλx˙dt=[eρtλ(t)x(t)]00eρtx(λ˙ρλ)dt

その用語を再置換

J(u)=0eρt[H(x,u,λ)+x(λ˙ρλ)]dtlimteρtλ(t)x(t)+λ(0)x(0)

定義

x=x+εqu=u+εp

与える

J(ε)=0eρt[H(x+εq,u+εp,λ)+(x+εq)(λ˙ρλ)]dtlimteρtλ(t)[x(t)+εq(t)]+λ(0)x(0)

最大 FOCJε=0

Jε=0eρt[Hxq+Hup+q(λ˙ρλ)]dtlimteρtλ(t)q(t)=0

以来、およびとらわれないれる我々が持っている必要があり qp

Hu=0Hx=ρλλ˙limteρtλ(t)=0

必要十分条件をまだ特定しましたか?
ジャムジー

これはどのような経済状況で起こりますか?
スタンシャンパイク

たとえば、ラムジーモデルcer.ethz.ch/resec/people/tsteger/Ramsey_Model.pdf
無知

1
このスレッドは、実際にはeconにリンクされていないため、math.stackexchange.comに適していると思います。MODが転送する場合があります。
無知な

ここで何が尋ねられるのかわかりません:BertsekasごとにHJBを解くだけで十分であれば、「追加の最適条件を心配する」必要はありません。HJBが解決されなかった場合、「必要かつ十分」に対する「十分な」だけが生じます。その場合、「これは解決策がないという意味ではありません」と言うでしょう。ちなみに、ここでの試みIとIIは貴重なコンテンツです。最初はHJBとOptimal Controlの間のリンクを示し、2番目はOptimal Control FOCの導出方法を示しています。
アレコスパパドプロス

回答:


1

(これはおそらくコメントと見なされるべきです。)

HJB方程式を解いた場合、最適な解を得るのに十分です。したがって、あなたは「他の最適条件に関心を持つ必要はありません」。あなたの質問に答えているように思われる。

あなたは定理の「必要な」要素を心配しているようです。ステートメントの必要性の側面は次のとおりです。最適なソリューションが存在する場合、HJB方程式のソリューションが存在する必要があります。

この特定の問題に取り組んだことはありませんが、一般的な答えは、微分可能な関数Vを期待していないということです。したがって、記載されている方程式の解はありません。代わりに、一般化された導関数を見て、HJB方程式を不等式に変換する必要があります。その場合、「粘度ソリューション」を取得できます。一般化されたデリバティブを使用するように拡張する場合、そのようなソリューションが常に存在することを証明することが可能かもしれません。あなたの証明を見ると、微分可能性を仮定しているので、それらは必要条件に役立ちません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.