理工学研究科Graduate School of Science and Engineering
ELC500X2(電気電子工学 / Electrical and electronic engineering 500)知的制御特論Intelligent control
伊藤 一之Kazuyuki ITO
授業コードなどClass code etc
学部・研究科Faculty/Graduate school | 理工学研究科Graduate School of Science and Engineering |
添付ファイル名Attached documents | |
年度Year | 2023 |
授業コードClass code | YA516 |
旧授業コードPrevious Class code | |
旧科目名Previous Class title | |
開講時期Term | 秋学期授業/Fall |
曜日・時限Day/Period | 月2/Mon.2 |
科目種別Class Type | |
キャンパスCampus | 小金井 |
教室名称Classroom name | 各学部・研究科等の時間割等で確認 |
配当年次Grade | |
単位数Credit(s) | 2 |
備考(履修条件等)Notes | |
実務経験のある教員による授業科目Class taught by instructors with practical experience | |
カテゴリーCategory | 電気電子工学専攻 |
すべて開くShow all
すべて閉じるHide All
Outline (in English)
The goals of this course are to
(3)Obtain basic knowledge about intelligent control.
(4)Understand learning process in Reinforcement Learning.
(5)Write a program of Reinforcement Learning using C language.
Grading Criteria
Report(homework) 50%, In class contributions 50%
授業で使用する言語Default language used in class
日本語 / Japanese
授業の概要と目的(何を学ぶか)Outline and objectives
強化学習を用いたロボットの制御について講義する.
実環境に対して強化学習を適用する上での問題点を理解するとともに,実際に強化学習を基にした制御系の設計を行う.
到達目標Goal
強化学習を基にした制御系を設計できるようになる
この授業を履修することで学部等のディプロマポリシーに示されたどの能力を習得することができるか(該当授業科目と学位授与方針に明示された学習成果との関連)Which item of the diploma policy will be obtained by taking this class?
ディプロマポリシーのうち、「DP1」「DP2」「DP3」に関連
授業で使用する言語Default language used in class
日本語 / Japanese
授業の進め方と方法Method(s)(学期の途中で変更になる場合には、別途提示します。 /If the Method(s) is changed, we will announce the details of any changes. )
前半は,講義形式の授業を行い,実環境に対して強化学習を適用する上での問題点や注意点を解説する.
後半は,演習形式の授業とし,制御系の設計とロボットへの実装を行う.
課題等の提出・フィードバックは「学習支援システム」を通じて行う.
アクティブラーニング(グループディスカッション、ディベート等)の実施Active learning in class (Group discussion, Debate.etc.)
あり / Yes
フィールドワーク(学外での実習等)の実施Fieldwork in class
なし / No
授業計画Schedule
授業形態/methods of teaching:対面/face to face
※各回の授業形態は予定です。教員の指示に従ってください。
1回[対面/face to face]:強化学習の概要
本授業の目的と,強化学習の概要について述べる.
2回[対面/face to face]:強化学習のアルゴリズム
Q学習を中心として,強化学習のアルゴリズムを解説する.
3 回[対面/face to face]:実環境への適用における問題点
状態爆発,汎化能力の欠如,実時間学習など,実問題への適用にあたっての問題点を解説する
4 - 6 回[対面/face to face]:実装1(シミュレーション)
ノートPCを用いて,シミュレーション上で強化学習を行う
7-14回[対面/face to face]:実装2(実問題への適用)
ライントレースロボットを例題として、強化学習を実装する。最後に実装結果をレポートとして報告する
授業時間外の学習(準備学習・復習・宿題等)Work to be done outside of class (preparation, etc.)
【本授業の準備・復習時間は、各4時間を標準とします。】各講義の内容を復習し,理解しておくこと.
テキスト(教科書)Textbooks
伊藤一之著,ロボットインテリジェンス,オーム社,2007
参考書References
日本ロボット学会誌
人工知能学会誌
計測自動制御学会論文誌
成績評価の方法と基準Grading criteria
出席・授業態度(30%),および,レポート(70%)により,総合的に評価する
学生の意見等からの気づきChanges following student comments
プログラム全体の構成を説明する必要から,スライドの文字が小さくなる場合がある.見難い場合には,前方の席に座る,オペラグラスを用意するなど,各自適切に対処をされたい.
学生が準備すべき機器他Equipment student needs to prepare
ノートPCを持参すること