最適制御則の安定性


3

線形最適制御、線形二次レギュレータでは、次の形式のシステムがあります:x = Ax + Bu、最適制御法則Uは状態フィードバックであり、リカッチ方程式解と状態ベクトルの関数です。安定性について、最適制御則Uは常に安定していますか?システムは常に安定していますか?デモンストレーションに関する参考資料を教えてください。


1
LQRコントローラは確かに何の答えは、私はより詳細にそれを説明することができ、後に、今日存在しない場合には、リアプノフ関数として1/2 x」はPのX、Pは代数リカッチ方程式の解であることを考えることを証明するために、安定化された
OpticalResonator

回答:


3

したがって、あなたの質問を正式に繰り返すために、無限の地平線連続時間最適制御問題を考えます

J(x0)=min0x(t)TQx(t)+u(t)TRu(t)dt

基本的にシステムダイナミクスと初期条件のみの制約があります

x˙(t)=Ax(t)+Bu(t)x(0)=x0

コスト行列は正の半正定値、正定値と仮定します。Q=CTCR

ペアならば、制御可能であり、ペア観測可能である、我々は見つけることができるユニークな、正定解 ARE(代数リカッチ方程式)のために(A,B)(A,C)P

PA+ATPPBR1BTP+Q=0

このソリューション作成できる3つの素晴らしいステートメントがあります。P

  1. 最適なコストは単純にJ(x0)=x0TPx0
  2. 最適な入力はu(t)=R1BTPx(t)
  3. 閉ループは漸近的に安定です。x˙=(ABR1BTP)x

ステートメント3の証明のアイデアは、最適なコストをリアプノフ関数としてとることです。

V(x)=xTPx、これは正定値です(は正定値であるため)P

したがって、が負の半正であることを示す必要があります。V˙

V˙ =2xTPx˙=2xTP(ABR1BTP)x=2(xTPAxxTPBR1BTPx)=xT(PA+ATP)x2xT(PBR1BTP)x=xTQxxTPBR1BTPx

両方のならびに半正定値であるので、負の半正定値です。QPBR1BTPV˙

これにより、原点での安定性が証明されます。

今、最大不変集合を検討し、出力を検討します。両方のでならびに非負であり、それらは両方とも独立してゼロでなければなりません。我々ことを知っています。また、であることがわかります。{xRn|V˙(x)=0}y=CxxTQxxTPBR1BTPxxTPBR1BTPx=xTPBR1RR1BTPx=uTRu0u0yTy0

y=Cx=0y˙=CAx=0y¨=CA2x=0

(A、C)が観測可能であると最初に仮定したので、行列はフルランクであり、は最大不変集合不変解のみ。[ CCA  ]x0{xRn|V˙(x)=0}

これにより、(最終的に)原点は漸近的に安定します。

どこかで間違いを犯さなかったことを願っています。後でもう一度調べます。さらに参照するために、たとえばこのペーパーをお読みください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.