理工学部Faculty of Science and Engineering
ELC300XD(電気電子工学 / Electrical and electronic engineering 300)知的制御Intelligent control
伊藤 一之Kazuyuki ITO
授業コードなどClass code etc
学部・研究科Faculty/Graduate school | 理工学部Faculty of Science and Engineering |
添付ファイル名Attached documents | |
年度Year | 2022 |
授業コードClass code | H5530 |
旧授業コードPrevious Class code | |
旧科目名Previous Class title | |
開講時期Term | 秋学期授業/Fall |
曜日・時限Day/Period | 火4/Tue.4 |
科目種別Class Type | |
キャンパスCampus | 小金井 |
教室名称Classroom name | 各学部・研究科等の時間割等で確認 |
配当年次Grade | |
単位数Credit(s) | |
備考(履修条件等)Notes | |
他学部公開科目Open Program | |
他学部公開(履修条件等)Open Program (Notes) | |
グローバル・オープン科目Global Open Program | |
成績優秀者の他学部科目履修制度対象Interdepartmental class taking system for Academic Achievers | |
成績優秀者の他学部科目履修(履修条件等)Interdepartmental class taking system for Academic Achievers (Notes) | |
実務経験のある教員による授業科目Class taught by instructors with practical experience | ○ |
SDGsCPSDGs CP | |
アーバンデザインCPUrban Design CP | |
ダイバーシティCPDiversity CP | |
未来教室CPLearning for the Future CP | |
カーボンニュートラルCPCarbon Neutral CP | |
千代田コンソ単位互換提供(他大学向け)Chiyoda Campus Consortium | |
カテゴリー<理工学部>Category |
電気電子工学科 学科専門科目 |
すべて開くShow all
すべて閉じるHide All
Outline (in English)
The goals of this course are to
(1)Obtain basic knowledge about intelligent robot.
(2)Understand learning process in Reinforcement Learning
(3)Write a program of Reinforcement Learning using Visual Basic.
Grading Criteria
Term-end examination : 50%, Report(homework) 30%, In class contributions 20%
授業で使用する言語Default language used in class
日本語 / Japanese
授業の概要と目的(何を学ぶか)Outline and objectives
強化学習のアルゴリズムを理解し,仮想空間で自律的に振舞うロボットの制御を行う
到達目標Goal
強化学習のアルゴリズムを理解し,ロボットの制御に適用できるようになる
この授業を履修することで学部等のディプロマポリシーに示されたどの能力を習得することができるか(該当授業科目と学位授与方針に明示された学習成果との関連)Which item of the diploma policy will be obtained by taking this class?
ディプロマポリシーのうち、「DP1」と「DP2」と「DP4」に関連
授業で使用する言語Default language used in class
日本語 / Japanese
授業の進め方と方法Method(s)(学期の途中で変更になる場合には、別途提示します。 /If the Method(s) is changed, we will announce the details of any changes. )
前半は講義を中心として強化学習のアルゴリズムを理解し,後半はEXCELのVBAを用いて実際に強化学習を実装する
課題等の提出・フィードバックは「学習支援システム」を通じて行う
アクティブラーニング(グループディスカッション、ディベート等)の実施Active learning in class (Group discussion, Debate.etc.)
あり / Yes
フィールドワーク(学外での実習等)の実施Fieldwork in class
なし / No
授業計画Schedule
授業形態/methods of teaching:対面/face to face
※各回の授業形態は予定です。教員の指示に従ってください。
1[対面/face to face]:「知的制御」
強化学習,サブサンプションアーキテクチャなど,さまざまな知的制御について概要を解説する
2[対面/face to face]:「強化学習1」
強化学習のアルゴリズムを学ぶ
3[対面/face to face]:「強化学習2」
強化学習のアルゴリズムを手計算で実行し,理解する.
4[対面/face to face]:「EXCEL Visual Basic1」
基本演算,分岐,繰り返し計算
EXCEL Visual Basicの使い方を学ぶ
5[対面/face to face]:「EXCEL Visual Basic2」
ファイル処理,グラフ処理
EXCEL Visual Basicの使い方を学ぶ
6[対面/face to face]:「強化学習の実装」
環境設定,初期設定
学習環境をコード化する
7[対面/face to face]:「強化学習の実装」
最大値の取得
最大値を取得するためのコードを実装する
8[対面/face to face]:「強化学習の実装」
状態認識
状態を認識するためのコードを実装する
9[対面/face to face]:「強化学習の実装」
行動選択
最適行動を選択するためのコードを実装する
10[対面/face to face]:「強化学習の実装」
ε-greedy法
Q値の更新を行う学習則のコードを実装する
11[対面/face to face]:「強化学習の実装」
Q値の更新
ε-greedy法のコードを実装する
12[対面/face to face]:「強化学習の実装」
全てのコードを結合して強化学習のコードを完成させる
13[対面/face to face]:「総合演習」
ε-greedy法
ε-greedy法の設定を変更して学習を行い,設定値の違いが学習結果に与える影響を考察する
14[対面/face to face]:「総合演習」
学習率
学習率の値を変更して学習を行い,学習率の値の違いが学習結果に与える影響を考察する
授業時間外の学習(準備学習・復習・宿題等)Work to be done outside of class (preparation, etc.)
【本授業の準備・復習等の授業時間外学習は、4時間を標準とする】前回の講義内容を復習し,理解しておくこと
テキスト(教科書)Textbooks
伊藤一之著,ロボットインテリジェンス,オーム社,2007
参考書References
授業中に紹介する
成績評価の方法と基準Grading criteria
平常点(20%),レポート(30%),期末試験(50%)により総合的に評価する
学生の意見等からの気づきChanges following student comments
プログラム全体の構成を説明する必要から,スライドの文字が小さくなる場合がある.見難い場合には,前方の席に座る,オペラグラスを用意するなど,各自適切に対処をされたい.
学生が準備すべき機器他Equipment student needs to prepare
ノートPCを持参すること
(貸与PCが望ましいが,EXCELがインストールされていれば,それ以外のPCでも可)
その他の重要事項Others
企業での開発経験ならびに,国際レスキューシステム研究機構との共同研究経験を活かし,実際の課題解決への取り組みや,その際の問題点などについても講義する.