制御系設計論2021_09_玖Part2:最適制御と動的計画法

「制御系設計論」の講義動画です
この動画では,最適制御と動的計画法について説明しています.

0:00 準備
0:40 最適制御とは
5:20 最適制御問題の解法(HJB方程式に帰着)
8:00 動的計画法(最適性の原理)
14:30 Riccati微分方程式と最適入力
21:30 例題

 

【書き起こし】制御系設計論2021_09_玖Part2:最適制御と動的計画法

(00:01) 皆さんこんにちは南ですこの動画では最適 制御についてお話をしたいと思います前回 の動画では最適レギュレータを紹介しまし た それがですねどのように同一されるのかと いうのをですねこの動画では説明していき たいとおもいます 講義ノートは4ページありますまず1 ページ目です 2ページ目 ページです 最後はへトレーダーになっております4 ページ目ですね 準備は宜しいでしょうかそれでは講義の方 を集めていきたいとおもいます最適制御 ですねハード最適レギュレーターのヘッド を勉強しましたので越冬はその雰囲気は雨 ていると思いますけれどもある制約条件の 下で評価感想を最小化するような入力を 決定する問題を貼っとくそういったことが まああの目標となります もう少し入れてイメージを伝えしていく ことですね例えばのある地点エーカーです ねある地点 b までを荷物を運ぶという
(01:06) ものが考えたとしましょう x デールからは xtf ということで まぁ時刻 tf でその目標地点 b に 到達させるという問題ですね a てこのは経路は色々と様々考えられる わけですね色んな経路を取ることができる わけなんですけども えーとこれをま最適化しましょうという ことなんですね 最適化するときに制約条件がいろいろと あると思います例えばなるべく早くと まあそういう なるべく早く b 地点に行きたいという そういう仕様があるかもしれませんし あとですねねん涼介消費燃料ですね ネットは荷物を運ぶときに何か車とか頭 固く場合にはですねその消費燃料っていう のもお子様なってきますので s その消費燃料を抑えると というそういう制約もあるかもしれません こういったいろんなしようとか制約の下で 最適化を行うというのが最適制御問題です になります 東前回紹介した最適レギュレーターはまあ その一種ですねなっていますでここに書い
(02:11) てますがまぁいる球体的制御と呼ばれる ものになっていたわけですねフェアーの 限定されていまして何が限定されたかと いうとはまずシステムが普通は一般形でも 視点系システムで含めて最適制御という ものは考えることができるんですけどもう 8 ra 9最適制御の場合はシステムは x とって= a 9スターズ du と いうパー線形システムであったということ ですね あとシステムはマ x とって= x + ビールとまあこういうまあこのへシステム に対して最適性を考えているということ ですねそれからねと下にも書いてますけど も評価関数をも定めるわけですけどもこれ 二次形式の評価関数を定めていて 初級子ここから無限時刻まで無限時間先 までの その最適化問題を考えていたということに なります デートも最適化問題は無限時間の最適化と いうことになっていました 無限時間の最適化ですね評価からそ最初に
(03:25) するような制御入力いうを求めるという 問題を最適でゲーターでは問題が考えたと いうことです ここではまあそれを導出するんですけれど も8ですねまずという間時間の最適化問題 でものを考えてみたいと思います えっとまぁの 右上に書いてますけどもあるところから ある b 地点まで a 地点カーディし てまで到達させるなまぁ制御入力っていう のを考えると口を止めるという問題なに なるんですけどもある 近く tf というのが決まっていると いうことですねなので8まあ積分の範囲が ゼロから tf ということになってます この tf のことを終端時刻という風に 呼んだりします 分 えっと終端 週刊時刻ですねはい終端時刻パーティー f というのがワールと それから8 この終端時刻におけるコストですねはい
(04:29) 終端コストと言いますけどもそれもご設定 されているよということですねはい無限 時間の際テイクアウトはあのように出てき ませんでしたけれどもという間時間の最適 化問題ではこの終端コストというのはご 登場するとということになっています 設定することができるというわけですね 右端コストですね回いっこういったものを a 棟3個の評価から蔬菜証明するような 入力を決めるという問題になるわけですね でここからはですねまずこのいう間時間の 最適化問題を解きます といてこの終端時刻ですね終端時刻を tf をですね無限大肉を飛ばすことによって このと最適でデーターをオスしようという そういうえっと説明になります このいう間時間の最適化問題の解法なん ですけどもあの最適化の勉強された方はの わかってるかもしれませんが8いくつか ありまして一つは越冬 この説明するんですけどもベルマンの
(05:34) えっと動的計画法 ダイナミックプログラムというものが一つ あります それからもう一つはですね本取り id ん ですねポントリャーギンの a 最大原理 は最小原理と呼んでる子しますけれども8 本取りありーの 脳へと政井大臣が を使って解くというものがありますはい あの基本最適化問題というのは変分法なの で干支ばそれを特殊方がまいくつかあると いうことなんですがとこのへ動画でおです ね8ベルマン動的計画法こちらを使って8 都会を求めてみたいと思います まあ動的計画法ではですねどういう8 えっと形になるかということなんです けれどもなどういうふうに問題を考えて いくかなんですけども を的加工ですね ダイナミックプログラミング ヘッドまあのの変分法を踵があの8
(06:41) 問題はですね問題のそのですねあミルトン ヤコビベル魔法停止という偏微分方程式に 方ねえと6問題に帰着させるというのが ポイントになっています でまぁこの後ハミルトンヤコビベル魔法 停止っていうのが登場してマートそれを 統計は8 その最適化最適制御問題の答えが見つかり ますよということになります いるとんやこれ ているもん これはのヘンリーは方程式です 塩微分方程式を解くということになります ちょっとあの説明こうざっくりとべ使う ものになってくると思いますけどもう ちょっと流れを説明してみたいと思います
(07:46) やりたいのはどれこの8これですねはい この a 棟 4日関数ですねこれを最小化するようなは 制御入力まあ時刻 tf までの入力を 決定しようということです でこの8評価関数をのですね 4日間数はマジ黒ゼロからの評価をしてる んですけども時刻 t カーの評価を考え ていきます 時刻 t 時刻 t カーの評価をした ものをですねこの j へスターという ふうに愛知提示したいと思います これを考えましょう これを考えるんですけどもえっとですね 動的計画法ではですねこういう風な考え方 をしていきます パレット今えーっと そうですねある時刻 t っていうのが あって a ま tf といいですね時刻 がこうあるわけですよね でマルコに xt というところに好状態 がありましてここからですねまぁ制御に よく決定するんですけどもいろんなパスが
(08:52) あると思うんですねこうイランいろんな パスがことれると思うんですよ ここに 到達させるためのまあいろんなパスがある と思うんですけどもとこれを見つけていく ということで最適化してへの制限額を決定 していくということですね胴体県河口では こう考えるんですけどもこれをやるんです けどもえーっとこういう風に考えます 8 この it 化の空間をですねちょっと半分に 半分に分けるんですね8 t と t + でルターティーマ微小なんですけどもまぁ この8いいいいから t +でルター t のはーいといい+でルター t カー tf までのハワイですねこの2つにえっと交際 的確かを開けるということになります 小分けた時にですね例えば8近衛 t カー t +てルター t ところ色んな子パス がこうあると思うんですね の区間でのえっとまぁ 省からそう最小にするような 我流とあると思いますはい えっとこあるんですねでこの
(09:55) ハートですけどもここでまぁ最低顔するん ですけどもこの後この後は結局何か最適化 をしますよねということですねそこから5 最適な8パスが 1本決まるはずなんですね このエティパステル dirty がどこ にいようともですねそこからのパスって いうのは結局最低顔しますので何か1本 決まるわけですねはいこうやって決まるよ ということですってこういうふうにですね どうもある部分を最適化するんですけど そこから先の部分はですねまた最低かさ れるでしょうということでそこは最適に なるという風にa 方が仮定して8まあ その えっと今の場合たらこの イープラスでルーター t の範囲がこの 最低かを考えましょうということです でまぁ今の話ちょっとわかりづらいかも しれませんけども評価関数をですねうん ちょっと変更してるんですけれども 81個目1行目館に行目に入っているのは 実はそういう話になってまして この後半部分ですね9 j エスターの xe パステルたーーーー t っていう のは8この後半部分のコースとなんですね
(11:01) 9 こうストーンです のデートまあ最適化されるでしょうといっ たところの雄と雄まあ ja スター書い て不具合てるんですけれどもこういう数 終端酵素だと思ってこの黄色の部分ですね 黄色の部分の最適化をやりましょう そういうふうにします こういう風にするとです猫再帰的にこう かけているということでまぁこれをですね 8まあ後ろの時刻から順番にやっていけば ですね8全体として最適化ができますよね というそういうのがだで同党提携が校と いうことになります ってことで by もある一部分だけ 抜き出しましたけれどもこれをまあ後ろか 順番以降伸びていけば8まあ処刑時刻まで 戻ればですね8 最適入力は1個決まるとになります でこのえっと一応メーカー2行目今話をし ましたがこれは最適性の原理というものに なります 最適性の原理に基づいてまぁコルマー士
(12:11) 検定をしたとをちょっと端折ってるんです けどもまぁこういうふうにやっていると いうことですね あとはーですねえとちょっとあのもう少し レッド d デンター t おこう小さくしていく という操作がいるんですけどもまずあの で書いてますけどもえっとこのでコストの 部分ですねこのポストのの終端コストの 部分今 t +でルター t 4時刻から のポストになっていますけれども えーとこれはですね xt まは xt の まわりで底が展開をしましょうということ で sa えっとまぁに g 今イジョンホは無視し て一時の香だけ残していますと残しますと 実はこの姉と ja スターですけれども これはですねこういう風に書くことが できる ことですねえっとこの部分最初の部分は この最初の部分は同じですここですねそれ と一緒ですねはいこと一緒です この後半のコースとて書いている終端 コースとってかなって部分がをテイラー 展開されまして ja スター xt と 後一時の幸ですねはい mede で偏微分スターずっと x
(13:17) ヘンリーをしたりするということで8これ でテイラー転嫁できているということで そうするとこれ左辺にですね jester がテコにもへじへスターがありますこれが キャンセルします キャンセルします ということでエチャせずさらにですね8 禁じ極限をとっていきますけれども 塗料片をデルター t で割りますそして でルター t を0に8極限取りますと8 話こういう ヘンリーの方程者出てきますよということ になり まぁ途中ちょっとやのこのデルタでるでる データー x デルター t がですね時 までルター t 極限取るとも x とっ だというふうになりますのでこれをですね x パス b を代入しますとまあこう なるということです あと終端条件ありますね終端条件は魔攻 ですよねということでこの2つ日本でへと ハミルトン薬味ベルバー方程式という エフェンディの方程式になっているという ことになります
(14:20) 考え方こういう形であとはこれを取っとけ ばいいんですねねこれ抑えるヘッド置いて おいて英語入力を決定すれば8最適にいる か決まるという流れにあります 得意ときますときますでこのこれが今 先ほどを見せしたこのスタート書いてます が先ほど導出したハミル美脚ハミントンや 首便は方で仕切る ねこれときますえーまぁあのいう理由に 関してこう最小化をしていくわけですけど もえっとですね とまぁこの中身ですねこの中身 を最小にするような入力が決まればいいの でその中身を言うで偏微分しまして 8=ゼロとなる8 ああいうを求めれば ok ということな んですよね ちょっと書きますとまああの中身ですね まぁいうこういうで中身こう中身を子微分 して=0となる英雄を求めればいいとそう するとはこれがも止まるということです 大丈夫でしょうかねちょっと見てもらうと
(15:26) いいんですけども えっとこの x-ここでなくなりますよね いうでヘンリー6 この部分が8残りますよねはいru て形 のかな 8そしてえっとこの部分もえっと x の ところが切れますけれども8 b ゆうの ほうだけ残りますでと結局この8 ru 以降 ru +これかける b ですね これから残ると=0にしますので1曲いう =-1/2のですね8 re バースト いうことにこの箱がやはり彼に by noah あるとなく はいということでこうなっていっ このようにしてへとマニュアル幹部は元 舞う ねえっと後この部分ですねこれはの スカラーですのでこの展示入れ替えても いいですよねのデートここになってとこの ようにネット入力は決まると で後も止めないといけないのはこの部分 ですはいこのですね なくなっちゃいましたけどここ俺です これさやと決まればえっと制御にいるが
(16:30) 決定できるということですね んでこれを求めましょうということで 8制御入力今きま決めましたので8それを です形が決まりましたねはそれをミートに 今ヴェルマ方程式に代入してあとは8 ラウンド j スターラウンド x を 求めればいいというわけです あれと嬉しいですよねっ ん ここからこのラウンド j スター ラウンド x をまあその求めるわけです けれども 8そもそも j は8二次形式だったん ですよね 平和二次形式だったので ところ j へスターも二次形式でしょう ということをそういうことを仮定します を描いていますねデイスターを x 天地 ex 展や x 天地 px という形で 仮定します エコ仮定してへと得ということになるん ですけども えっとまぁあの子様に仮定しますとマーズ ですねえといいで偏微分すると 姫で偏微分するどうなるかというとこれは
(17:34) のまあ x のところは無視していただい て江藤これ子ですね p . tt です ねこういうふうになりますね それから x 編日もします 育成偏微分するとえーとこれは 奪いの tx ということになります これを踏まえて越冬 まあ求めればいいんですけどこれでも 止まっているが今日はこれでえっとここに これが古代 new ですね高校を代入 すると も止まる訳ですけどアトピーが部止まれば いいですよねアトピーを求めれば ok だ で p を求めるんですがまあこのあたり の八尾ですねあ見たいかヴェルマ方程式に 代入してま整理していくとマールその8 方程式が出てくるんですね それはとけば p をも止まるよという そういう子での仕組みです ちょっと最後ヘッドまとめますけれども まず ut はも決まりました ut は 形が決まりましたね ft という f txt というですね8形になっていると
(18:40) か状態フィードバックになってますよね ネット ft がどうなっているかといい ますと マイナスの r インバースの b 天地 dt とっていうことになりますねあのー 9色見ていただくダサいとこの2倍の px 代入しますので甘いなサールインバース b 天地 exa 形になっているというわけですね エアーた t はも止まるんですけども バックも飛べないといけないですね op はそのハミィと猫ぺるま方程式にこの赤い のもの代入して8ちょっと計算すると出て きます へ導入は出てくるかといいますと マイナスのエイドと = u +あ a 電池 pt ますっ eta えっ ヴァイナスの apt r インバーすっ兄天地ティティ ですねなりますねあと終端自国でも決まる
(19:48) ので ptf が急ですと 中 fs ということでへとこれこういう のが出てきんぱのいられますねこれを解け ば p をも止まるよということだねえ これは微分方程式なんでは解けるんです けども8微分方程式これ名前が付いてまし て ボスで見たことありますよねうんのいた ことある形なんですよこれはで勝ち方程式 に入ってますね カッチの理論方停止 リカチ微分方程式とのが出てきますねこれ 時は p をも止まって衛星輸入が決定 できるということになりますこれでまあ あのいう間時間の最適制御問題の答えが功 を得られるわけ よしでしょ であの最適レギュレーターはこの時刻 t をですね無限大に飛ばせば得られるわけ ですね時刻 t を無限大に飛ばせば得 られるはけども 8実はこの pt ねえ等この et はですね実は p 02 光の当たりに収束してですねこれがまあ p
(20:54) なわけですけども こうやって求めることができるということ に いいでしょうか こういうふうにも止まるというこそ を r 8 p にご収束するんですけれども ある実費に終息えっ 8あ愛が決まってこれが最適で言えるに なります いかがでしょうここで動的計画法で解くと こういう形になるというわけねっ 最後ちょっとあのレーダーをやって終わり たいと思いますけどもちょっとあまり説明 もなんかはしないんですが東今 x.= 毎夏に x +言うというシステムを考え ましょう で s からなんと簡単です熱からだし そして評価関数のコミュニケーシでものを 考えます まああのえっと 4日方程式の aba 日で書いてこと
(21:59) 映画-2でへと b が 1になっていますそしてと旧が1/2で r が2分の1になっていると思って ください こういう状況を考えていると これでこれに対してとま先ほど同じように ですねえっとこっちに書いてますけども 時刻 t から tf までのその強化と いうことで j estate いうのを 考えましょう そうするとハメ投薬ベル魔法廷氏がまあ あの子に書いてあるようなものが入ること ができれば先ほどちょっとや手順を 思い出してもらって同じようにあると8 こういうふうに得られる まただあの終端時刻は今設定のコストは ありませんのでまぁそこはゼロになって いるということですね これであとはここの中身のというに関して こう偏微分してと=0ものを見つければ ok なんですけども ember 見つけるところが始めるんですけどもまぁ これはいいですよねえっという t call マイナスの
(23:03) んだぜー エスターラウンド x ということになっ てますねっ これここにここにあるやつをねっ 8編李老師へという ボール0を求めれば コーナーということがわかると思い でこれを 俺に 大入しま するとこういうのはれてくるん こういうのが込んでていく えっここでもさっきと同じようにですねっ と ptx の事情ですねはいこういうふうに 8まあ jester を仮定しますと ありがちでいう方程式は選んだ こういうふうにも止まる求めることが
(24:23) できるまぁ実際ポニーです皆さんえーと あの j スターカーデイスターを殴打と 体あのホモと仮定してです猫にこう代入し てちょっと計算していただくとまあこう いうのが方程式が出てくることがわかり ます あとはこれ微分方程式ですのでとけばいい と事情がこれわかりづらいですけれども これここ事情ですね dp 2/ t の字路を+4 p + 1/2 a これをエビボードでしておけば よろしいということでねちょっとみなさん 頑張ってとかないってちょっと口の難しい のかもしれませんけども解けるんですけど もときますとどうなるかというと apt は ヴァイナスの1/2 ちょっとごちゃごちゃしてますけどまぁ- 2 とルーと思う の いうとこ 思い出す +に暮らせるとこ 英文の 歌をさせてますね
(25:26) のに入ると号の 2-って由布 まあ康一ちょっと こんな風にですねえとを求めることができ ます あの制御入力自体は ut コールですね えと-22 pt の xt になります ので合間このこれですね 8はいこれを x デーがまぁこうなると けども 9 pt はこれです これで越冬制御入力が決定的 まあついてなのでとこれ極限と t を 無限大に飛ばす時ですね最適できデータに なりますのでとそれを確認してみたいと 思います今の上に書きましたけどもまぁ 映画-2レディーが1定休は1/2で r は1/2なのでこれで最適で偽データと あの求めるとですねちょっと皆さんもやっ
(26:29) て頂ければと思いますが何か調停し孤独と パピーですねこれが2分の-2+ルート 52があるんですね なので a というはですね これ代入して真夏キー b inverse うっ 8 x かになると でまぁここはの場合出すのに場合の xt ですか こういうふうに今も止まるわけですねはい これが最適で切れたということになります これになるかどうかなんですけどもまぁ なるんですが 止まってず いいコール0 おっ ef を現代2個持って行きますと いいわ
(27:31) p 0なんです こんな風にも止まるんですねえっとここの tf 無限大に飛ばすんですが正木を. ar 4棟 そうですね含め心 ttf おこう無限大 に1波飛ばすんですけどもはいすいません と極限取るとこれ rp trp に収束 するんですがまあこれはの20年実は ipa になってねそれ来たよっ これがまあそうなんですもうえっと大間 tiff 無限大するんでこれで tf げ ないとバストえっとこの指数のここの部分 ですね 俺これが8全図2 マイナス無限大になりますねこれが12や ゼロになるわけでなんでここもえっと うーんと ええがなはいっ ということでへと結局ですねと5-が
(28:36) キャンセルして2分の1と本文市街地と 8分母の方はににに+ルートごとコロニー が勝手っていうことでこういう形になると あとこれをへという梨花 a するとまぁ 部への答えになってくるんですけれども2 分の -2+ルート号というのがこうも止まると いうことではいっ これで8も一応上の答えなんですね photo でえっと俺らは有限時間割い て一家でまぁその極限考えるとそれが最適 で切れたなっているということが分かり ましたと ちょっと説明 雑な部分がありましたけれども後 最適制御問題について今日はお話しをし ましたんこれで終わりたいと思います もっとからかもでした

————————————————
各回動画が2〜3本あります.
# Part1は,概要説明&復習用の動画です
# Part2が本編で板書スタイルとなります
# Part1→Part2→Part1の順に視聴し,ノート作成&練習問題をすると90分程度になります
————————————————

⭐️関連動画
Pythonで学ぶ制御工学
Part1(編集済み):https://youtu.be/36MzFQgqJcE
Part2(編集済み):https://youtu.be/tt0pWt-kKKU
Part3(編集済み):https://youtu.be/aCYJvYGZz3g

制御工学クイック学習:https://youtu.be/SSJNCZSzq4M
制御系設計(伝達関数編):https://youtu.be/b4X3wmXnHwM
制御系設計(状態方程式編):https://youtu.be/NhU5G3TTA8k

関連記事一覧

Skip to content