理工学部Faculty of Science and Engineering
COS300XG(計算科学 / Computational science 300)知識獲得Machine Intelligence
大嶋 良明Yoshiaki OHSHIMA
授業コードなどClass code etc
学部・研究科Faculty/Graduate school | 理工学部Faculty of Science and Engineering |
添付ファイル名Attached documents | |
年度Year | 2022 |
授業コードClass code | H9099 |
旧授業コードPrevious Class code | |
旧科目名Previous Class title | |
開講時期Term | 秋学期授業/Fall |
曜日・時限Day/Period | 水3/Wed.3 |
科目種別Class Type | |
キャンパスCampus | 小金井 |
教室名称Classroom name | 各学部・研究科等の時間割等で確認 |
配当年次Grade | |
単位数Credit(s) | |
備考(履修条件等)Notes | |
他学部公開科目Open Program | |
他学部公開(履修条件等)Open Program (Notes) | |
グローバル・オープン科目Global Open Program | |
成績優秀者の他学部科目履修制度対象Interdepartmental class taking system for Academic Achievers | |
成績優秀者の他学部科目履修(履修条件等)Interdepartmental class taking system for Academic Achievers (Notes) | |
実務経験のある教員による授業科目Class taught by instructors with practical experience | |
SDGsCPSDGs CP | |
アーバンデザインCPUrban Design CP | |
ダイバーシティCPDiversity CP | |
未来教室CPLearning for the Future CP | |
カーボンニュートラルCPCarbon Neutral CP | |
千代田コンソ単位互換提供(他大学向け)Chiyoda Campus Consortium | |
カテゴリー<理工学部>Category |
創生科学科 学科専門科目 |
すべて開くShow all
すべて閉じるHide All
Outline (in English)
This course deals with the theory and application of machine learning in the contemporary context of data science. In addition to the classroom lecture, students will become familiar with analysis by solving machine problems using Python libraries with sample data sets.
Grading policy is as follows:
In-class contribution: 30%
Homework and in-class assignment: 30%
Term paper: 40%
Your must achieve at least 60% in the overall grade to pass for academic credit.
The average study time outside of class per week would be approximately 4 hours.
授業で使用する言語Default language used in class
日本語 / Japanese
授業の概要と目的(何を学ぶか)Outline and objectives
大量のデータから抽出した特徴量の分析を通して得た知見を問題解決に活用するための手法を学ぶ。近年とみに注目されているデータ・サイエンスの基礎を理論といくつかの実践例から学んでゆく。
到達目標Goal
本科目では、以下の項目について理解する:
1)蓄積データの分析と特徴量抽出の手法
2)機械学習の理論と構成法
3)Pythonライブラリを使った分析手法
問題解決にとって必要な情報は何かを考えられること、それを計算機がうまく取り扱えるように抽出し学習させるにはどうすれば良いかを考えられるようになること。またビッグデータ、深層学習やデータサイエンスなどの言葉が指す領域について基礎的な理解を身につける。
この授業を履修することで学部等のディプロマポリシーに示されたどの能力を習得することができるか(該当授業科目と学位授与方針に明示された学習成果との関連)Which item of the diploma policy will be obtained by taking this class?
ディプロマポリシーのうち、「DP1」と「DP2」と「DP4」に関連
授業で使用する言語Default language used in class
日本語 / Japanese
授業の進め方と方法Method(s)(学期の途中で変更になる場合には、別途提示します。 /If the Method(s) is changed, we will announce the details of any changes. )
授業は講義方式で行う。テキストデータ、メディアデータなどを取り扱ういくつかの事例から、大量のデータから抽出した特徴量の分析を通して得られた知見を問題解決に活用するため手法について学ぶ。毎回の授業開始時に講義内容の復習を行い、授業内の課題や演習内容については理解度定着のためレビューを行う。
アクティブラーニング(グループディスカッション、ディベート等)の実施Active learning in class (Group discussion, Debate.etc.)
なし / No
フィールドワーク(学外での実習等)の実施Fieldwork in class
なし / No
授業計画Schedule
授業形態/methods of teaching:対面/face to face
※各回の授業形態は予定です。教員の指示に従ってください。
1[対面/face to face]:イントロダクション、データサイエンス入門
全体説明、機械学習とは何か、知識獲得とは何か
2[対面/face to face]:Bayesの決定則
Bayesの法則、誤り率の最小化、Bayesの分類器、識別関数
3[対面/face to face]:パラメータ推定と教師あり学習(1)
最尤推定、平均値と共分散行列の推定、Bayesの識別器
4[対面/face to face]:パラメータ推定と教師あり学習(2)
正規分布の平均値の学習、Baysian学習、十分統計量、次元数の問題
5[対面/face to face]:ノンパラメトリックな技法(1)
Parzen窓による推定、k近傍法(k-NN)による推定と事後確率、誤り確率
6[対面/face to face]:ノンパラメトリックな技法(2)
2値識別問題の近似、Fisherの線形識別関数
7[対面/face to face]:線形識別関数
線形識別関数と識別面、線形分離性、パーセプトロン基準、緩和法
8[対面/face to face]:ニューラルネット
パーセプトロンの発展系としてのニューラルネット
9[対面/face to face]:教師なし学習とクラスタリング(1)
混合分布と識別可能性、最尤推定、Isodata法、k-means法
10[対面/face to face]:教師なし学習とクラスタリング(2)
教師なしBayes学習、事後確率最大化パラメータ推定、評価関数
11[対面/face to face]:特徴抽出と次元圧縮
Fisher比、Mahalanobis距離、主成分分析
12[対面/face to face]:テキストデータへの応用
文書のクラスタリング、トピックモデル、レコメンド
13[対面/face to face]:音声データへの応用
隠れマルコフモデル(HMM)、音響モデル
14[対面/face to face]:画像データへの応用
コンピュータビジョン、特徴量の抽出、分類の手法
授業時間外の学習(準備学習・復習・宿題等)Work to be done outside of class (preparation, etc.)
【本授業の準備・復習等の授業時間外学習は、4時間を標準とする】授業内容の理解を深めるために、授業時間外には復習を十分に行うこと。学習内容の理解を深めるためにPCを使った課題実習にも取り組んで欲しい。
テキスト(教科書)Textbooks
特に指定しない。
参考書References
特に指定しない。必要に応じて文献を紹介する。ちなみに2018年度は以下を授業内で紹介した。学術書のほかに一般書も含まれるが、ビッグデータやデータサイエンスなど今日的な問題意識を深めて貰うために挙げた。
【基本図書】 杉山将、「機械学習のための確率と統計」、講談社(2015)
【視野形成・分野基礎】 久野遼平、木脇太一「大学4年間のデータサイエンスが10時間でざっと学べる」KADOKAWA (2018)
朝野熙彦、「入門 多変量解析の実際 (ちくま学芸文庫) 」、筑摩書房 (2018)
林知己夫、「調査の科学 (ちくま学芸文庫)」、筑摩書房 (2011)
【データサイエンス】 山内長承、「Pythonによるデータ解析入門」、オーム社 (2018)
【Pythonによる実習】 Alice Zheng, Amanda Casari「機械学習のための特徴量エンジニアリング」、オライリージャパン(2019)
クジラ飛行机「増補改訂Pythonによるスクレイピング&機械学習 開発テクニック」、ソシム(2018)
【理論書】 C.M.ビショップ、「パターン認識と機械学習(上)(下)」、丸善出版(2012)
成績評価の方法と基準Grading criteria
平常点(30%)、課題演習(30%)と学期末レポート(40%)によって総合的に評価する。設定した達成目標を60%以上達成している場合に合格とする。
学生の意見等からの気づきChanges following student comments
展開科目としての位置づけを考え、また理解度に留意して進める。特に授業内容と進度については受講者のフィードバックを歓迎する。毎年、履修者の幅広い興味に応えるべく努めており、学期末のレポートに受講時の気付きや感想を追記してもらうことで履修者からの意見を汲み上げており、2018年度は授業内容に対するアンケートを参考に改善に努めたことが好意的に受け止めてもらえたが、逆に2019年度には頻繁なアンケートに回答疲れが看取されたので、以降はむしろ授業開始時のレビュウに注力している。さらにPythonを利用してサンプルデータを分析、可視化することにより、講義だけではなく検証を組み合わせる事で、学習内容の理解がさらに深まるよう努めたい。2020年度にはGoogle Colaboratory環境を使用することでブラウザ環境でのPython例題の提示が可能となった。2021年度にはGoogle Formsを活用して毎回の授業内容の定着に努めるとともに都度都度の質問やコメントを汲み上げられるように工夫した。一方、実習に十分な時間をあてられなかった分をデモで補完したことが反省点であり、2022年度にはさらに授業内容を工夫して改善に努めたい。
学生が準備すべき機器他Equipment student needs to prepare
分析ツールを利用するため学内ネットワーク環境でPCを使う予定である。2020年度以降はGoogle Colaoratory環境でPythonプログラムを実行したので、特別なアプリのインストールは想定しておらず、ふだん使っているPCで良い。
その他の重要事項Others
【ジャンルキーワード】
データサイエンス、機械学習、確率・統計、ビッグデータ、パターン認識、深層学習
実務経験のある教員による授業
担当教員はIT企業での研究所勤務において15年間のディジタル信号処理(統計モデルによる音声認識、電子透かし)、マルチメディア処理分野での研究とシステム開発の経験がある。