全学PF_データサイエンス科目群Data Science Courses
PRI200LD(情報学基礎 / Principles of informatics 200)データサイエンス応用基礎FThe Basics of Applied Data Science F
廣津 登志夫Toshio HIROTSU
授業コードなどClass code etc
学部・研究科Faculty/Graduate school | 全学PF_データサイエンス科目群Data Science Courses |
添付ファイル名Attached documents | |
年度Year | 2024 |
授業コードClass code | A9807 |
旧授業コードPrevious Class code | |
旧科目名Previous Class title | |
開講時期Term | 秋学期授業/Fall |
曜日・時限Day/Period | 集中・その他/intensive・other courses |
科目種別Class Type | |
キャンパスCampus | |
教室名称Classroom name | 市市他‐その他 |
配当年次Grade | |
単位数Credit(s) | 2 |
備考(履修条件等)Notes | |
他学部公開科目Open Program | |
他学部公開(履修条件等)Open Program (Notes) | |
グローバル・オープン科目Global Open Program | |
成績優秀者の他学部科目履修制度対象Interdepartmental class taking system for Academic Achievers | |
成績優秀者の他学部科目履修(履修条件等)Interdepartmental class taking system for Academic Achievers (Notes) | |
実務経験のある教員による授業科目Class taught by instructors with practical experience | |
SDGsCPSDGs CP | |
アーバンデザインCPUrban Design CP | |
ダイバーシティCPDiversity CP | |
未来教室CPLearning for the Future CP | |
カーボンニュートラルCPCarbon Neutral CP | |
千代田コンソ単位互換提供(他大学向け)Chiyoda Campus Consortium |
すべて開くShow all
すべて閉じるHide All
Outline (in English)
[Course outline]
Data processing using programming languages plays an important role in big data analysis. In this lecture, students will learn the basics of data analysis and data mining through R programming exercises. This lecture covers basics of all process of the data analysis, such as modeling, analysis, visualization and validation.
The content of this course is equivalent to "The Basics of Applied Data Science E", but by using R, a statistical analysis tool, the course will be structured so that students can learn it without much prerequisite knowledge of programming.
[Learning Objectives]
The objective of this course is to acquire the foundation for handling large-scale data processing in the future.
[Learning activities outside of classroom]
Students will be expected to spend four hours to pre/post study of the course, and solve the assignment every other week.
[Grading Criteria /Policy]
Your overall rating in this class will be calculated from the results of the assignment (100%).
授業で使用する言語Default language used in class
日本語 / Japanese
授業の概要と目的(何を学ぶか)Outline and objectives
ビッグデータの分析においてプログラムによるデータ処理は重要な役割を果たす。本講義では、データ分析やデータマイニングの基礎をRを用いた演習を通じて学び、将来的に大規模なデータ処理を扱うための基礎を身につけることを目的とする。具体的には、分析の目的や前提条件に応じた適切な課題の把握、対象のモデル化、分析・可視化・検証といった、データ分析に必要となる一連のプロセスを演習を通じて学んでいく。
本講義は主に理系学部の学生を対象として構成されている。内容については、プログラミングに関わる部分以外はデータサイエンス応用基礎Eと同等であるが、統計解析ツールであるRを用いることで、プログラミングの前提知識が少なくても学べるように構成している。
履修する上での注意を「その他重要事項」の項に提示しているので、履修するかどうかの判断の前に必ずその内容を確認すること。
到達目標Goal
以下のようなことができるようになることを目標とする。
・データ分析の基本的な技術について理解する
・R を用いて、基本的なデータ処理(モデル化と分析)をする
・R を用いて、データを視覚化し検証する
授業で使用する言語Default language used in class
日本語 / Japanese
授業の進め方と方法Method(s)(学期の途中で変更になる場合には、別途提示します。 /If the Method(s) is changed, we will announce the details of any changes. )
オンデマンド方式により配信された講義資料と動画で学習し、課題によって知識を定着させる。当初の数週間はデータ分析の準備として、処理に用いるRの基礎知識を学び、以降は各週ごとにデータ分析や視覚化、検証などのデータ処理に関するトピックを学んでいく。週1回のペースで講義映像が開示されるので、遅れずに視聴し学習すること(一定期間で視聴不可になるので注意)。特に、初回の配信映像で受講をする上での注意事項(演習や課題に対する質問も含む)説明しているので、早い段階に必ず視聴すること。
演習や課題に対して指定の方法で出された質問については、学習支援システムの掲示板機能などを通じてフィードバックする。
アクティブラーニング(グループディスカッション、ディベート等)の実施Active learning in class (Group discussion, Debate.etc.)
なし / No
フィールドワーク(学外での実習等)の実施Fieldwork in class
なし / No
授業計画Schedule
授業形態/methods of teaching:オンライン/online
※各回の授業形態は予定です。教員の指示に従ってください。
第1回[オンライン/online]:導入
・データエンジニアリングとは何か
・コンピュータの基礎
・用いるプログラミング言語について
・プログラミング環境の準備
第2回[オンライン/online]:R入門(1)
・基本的なデータの種類
・オブジェクト(変数)
・ベクトルの利用
第3回[オンライン/online]:R入門(2)
・関数の利用
・ベクトルの生成
・ベクトルの基本操作
第4回[オンライン/online]:R入門(3)
・組み込み定数
・ベクトルの種類と操作
・リスト
第5回[オンライン/online]:R入門(4)
・オブジェクトの表示
・オプション
・制御構造
第6回[オンライン/online]:実践的プログラミング
・関数の定義
・パッケージの利用
第7回[オンライン/online]:データの取り扱い
・行列
・データフレーム
第8回[オンライン/online]:データの視覚化
・散布図と折れ線グラフ
・ヒストグラム
・箱ひげ図
・棒グラフと円グラフ
・グラフの保存
・(参考)低水準描画関数
第9回[オンライン/online]:データの統計的扱い
・記述統計と推論統計
・要約統計量
・データ処理の手順
・データ欠損への対応
・データクレンジング
第10回[オンライン/online]:機械学習:回帰モデル
・データ分析:目的変数と説明変数
・機械学習技術の概観
・回帰モデル
・重回帰による分析
第11回[オンライン/online]:機械学習:ロジスティック回帰
・ロジスティック回帰による分析
第12回[オンライン/online]:機械学習:決定木
・決定木
・セグメントの抽出とその特徴
第13回[オンライン/online]:機械学習:教師なし学習
・教師なし学習
・クラスタリング
・クラスター数の推定
第14回[オンライン/online]:機械学習:モデルの精度と検証
・主成分分析
・モデルの検証
授業時間外の学習(準備学習・復習・宿題等)Work to be done outside of class (preparation, etc.)
本授業の準備・復習等の授業時間外学習は、各週につき 4 時間を標準とする。講義資料や映像により復習すると同時に課題に取り組むこと。
テキスト(教科書)Textbooks
参考書などをベースに作成した講義資料(スライド PDF)を提供する。
参考書References
特定の書籍はないが、R によるデータ処理・統計分析の書籍は多数出版されているので、必要であれば書店等で見て自分に合っていそうなものを使うと良い。以下に、何冊か紹介しておく。
・Rで学ぶ統計的データ解析、林賢一 他、講談社、2020 (ISBN: 4065186196)
・R統計解析パーフェクトマスター[統計&機械学習第2版]、金城俊哉、秀和システム、2022 (ISBN: 4798067725)
・The R Tips [第3版]、舟尾暢男、オーム社、2016 (ISBN: 4274219585)
成績評価の方法と基準Grading criteria
各回の講義内容に対する課題による(100%)
なお、講義映像は対面講義の教室での座学授業に替わるものであることから、授業への出席が単位取得の前提であるのと同様、その視聴は単位取得の前提となる(未視聴が多い場合には評価の対象者に含まれない)。
学生の意見等からの気づきChanges following student comments
映像視聴の考え方(視聴が単位取得の前提)について、他のオンデマンド講義の混乱から成績評価の基準ではないが上記に明示しているが、その内容について具体的な対応を含める形で明確化した。
学生が準備すべき機器他Equipment student needs to prepare
R を使うことができるPC(Windows, Mac, Linux のいずれでも可、ソフトウェアの導入については初回講義に説明をするので事前準備は不要)
その他の重要事項Others
本講義は「データサイエンス応用基礎E」と同等の内容であることから、重複して履修することはできない。
また、本講義は主に理系学部の学生を対象として構成されている。その他の学部でも、学部として受講可能と判断されている場合には履修可能であるが、この点を十分に理解した上で履修するかどうかの判断をすること。