イノベーション・マネジメント研究科Business School of Innovation Management
MAN530F2(経営学 / Management 500)データマイニングData Mining
豊田 裕貴Yuki TOYODA
授業コードなどClass code etc
学部・研究科Faculty/Graduate school | イノベーション・マネジメント研究科Business School of Innovation Management |
添付ファイル名Attached documents | |
年度Year | 2021 |
授業コードClass code | W0305 |
旧授業コードPrevious Class code | |
旧科目名Previous Class title | |
開講時期Term | 秋学期後半/Fall(2nd half) |
曜日・時限Day/Period | 月6/Mon.6, 月7/Mon.7 |
科目種別Class Type | 専門講義 |
キャンパスCampus | 市ヶ谷 |
教室名称Classroom name | |
配当年次Grade | 1・2 |
単位数Credit(s) | 2 |
備考(履修条件等)Notes | 経営情報修士科目 |
実務経験のある教員による授業科目Class taught by instructors with practical experience | |
カテゴリーCategory |
専門科目 経営情報修士科目 |
すべて開くShow all
すべて閉じるHide All
Outline (in English)
In this lecture, we think that data mining is a method to derive findings that contribute to business from data. Therefore, we will learn with the emphasis on what kind of data is applied to what kind of data as a tool, and how to use the result for business.
授業で使用する言語Default language used in class
日本語 / Japanese
授業の概要と目的(何を学ぶか)Outline and objectives
ビジネスでのデータ活用が期待されている反面、まだまだ十分に活用しきれていない状況がある。その一因としてデータ分析手法がExcelでできることのみに留まってしまっている点が挙げられる。そこで、Excelでできることを超えて、より積極的なビジネスデータ活用をデータマイニングという領域に広げ、学習する。その際、フリーソフトでありデータ分析に特化したR言語を活用し、より高度な手法を活用し、ビジネスデータから知見を導き出す(マイニングする)方法を学習するのが、本講義の目的である。
なお、本講義では、データマイニングをあくまでデータからビジネスに資する知見を導き出す手法群であると考え、数学的な解説よりは、道具としてどんなデータにどんな手法を適用し、その結果をどうビジネスに活用するかに力点を置いて学習していくこととする。
到達目標Goal
学習する手法について、各自のテーマに応用できることを目指す。その際、手法の仕組みについてある程度理解し、どんなデータにどんな手法を行うと何が明らかになるのかについて理解し、手法を活用できるよう担うことも目指す。
なお、Rについては、ゼロからスクリプトを書くのではなく、サンプルスクリプトを必要に応じて修正しながら使うことが出来るようになることを目指す。そのことによって、WEB上に公開されている無数のライブラリーやスクリプトを活用できるようになることを目標とする。
繰り返しになるが、本講義は数学としてデータマイニングを学ぶ講義ではなく、あくまでどのようにビジネスに活用するかを考えられる力を身につけることが目標となる。
この授業を履修することで学部等のディプロマポリシーに示されたどの能力を習得することができるか(該当授業科目と学位授与方針に明示された学習成果との関連)Which item of the diploma policy will be obtained by taking this class?
イノベーション・マネジメント研究科のディプロマポリシーのうち、「DP2」「DP3」に関連
授業で使用する言語Default language used in class
日本語 / Japanese
授業の進め方と方法Method(s)(学期の途中で変更になる場合には、別途提示します。 /If the Method(s) is changed, we will announce the details of any changes. )
講義では、手法の解説をしたうえで、実際に各自がRでデータを分析し、その結果を解釈するというスタイルをとる。Rについては初学者であっても理解できるように進めるが、ある程度のPCの知識と慣れを前提とする(フォルダとはなにか、データをCSV形式で保存する方法など一般のPC操作に共通する知識は知っていることが前提となる)。なお、Rの初学者は必ず第一回目を受講すること。
また、Rについては、ビジネスデータ分析アドバンスでも学習するため、データマイニングに先んじて、ビジネスデータ分析アドバンスの受講を強く推奨する。
アクティブラーニング(グループディスカッション、ディベート等)の実施Active learning in class (Group discussion, Debate.etc.)
あり / Yes
フィールドワーク(学外での実習等)の実施Fieldwork in class
なし / No
授業計画Schedule
※各回の授業形態は予定です。教員の指示に従ってください。
1-2講:データマイニング入門およびR入門
まずはデータマイニングとは何かについて、ビジネスへの活用という視点から整理し、学ぶ手法の全体像を理解する。
また、データ分析で多用されているR言語についての基礎を学習する。Rについて初めて習う人は必ず出席すること。
3-4講:回帰分析と決定木
ある結果に影響する要因(原因変数)の特定と構造を明らかにする方法として、回帰分析を学ぶ。なお、「回帰分析」については、ビジネスデータ分析(ベーシック)などでも学習するため、不安がある場合には事前に履修しておくことをオススメする。
その上で、条件分割によるモデリングとして「決定木」を学び、より複雑な構造を明らかにする方法について学習する。
5-6講:決定木の応用
「決定木」の応用として「ランダムフォレスト」や「ハイブリッド型樹木法」について学習し、より高度な分析方法を学習する。
7-8講:アソシエーションルール分析
何を買った人は他に何を買うかというようなルール抽出の手法として「アソシエーションルール分析(マーケットバスケット分析)」を学習する。
9-10講:QCA(質的比較分析)
データマイニングというとビッグデータが必要であると思われているが、実際のビジネスでは少数のデータをマイニングし知見を導き出す必要があることがある。その手法として「QCA:質的比較分析」の基礎を学習する。
11-12講:テキストデータの分析
ビジネスでは分析するデータがテキスト(文字情報)の場合も少なくない。そこで、テキストデータの分析としてテキストマイニングの基礎について学習する。
13-14講:まとめ:手法の組み合わせと追加手法の解説
まとめとして、ここまで学習してきた手法を組み合わせた活用方法や講義内に追加でリクエストされた手法の解説などを行う。
授業時間外の学習(準備学習・復習・宿題等)Work to be done outside of class (preparation, etc.)
本授業の準備学習・復習時間は、各2時間を標準とします。
必要に応じて分析手順などの動画をアップするので、予習・復習に活用し、実際に使える知識として手法を学習すること。
テキスト(教科書)Textbooks
特に指定なし
参考書References
・豊田裕貴(2017)『Rによるデータ駆動マーケティング』オーム社
・ブレット・ランツ(2017)『Rによる機械学習』翔泳社
・山本義郎、藤野友和、 久保田貴文 (2015)『Rによるデータマイニング』オーム社
※その他、随時紹介する。
成績評価の方法と基準Grading criteria
講義内課題ならびに普段の取り組み(40点)、期末レポート(60点)
学生の意見等からの気づきChanges following student comments
・受講に際し、前提となる高度な数学やデータ分析の知識は設定せず基礎から
解説するが、ビジネスデータ分析(ベーシックおよびアドバンス)で解説される要約とモデル分析の基礎についてはある程度理解していることを前提として講義をする。し
たがって、ビジネスデータ分析(ベーシックおよびアドバンス)を合わせて受講することを強く推奨する。
・遠隔での受講への要望に応えるため、対面講義と遠隔講義を併用する(遠隔参加のみでの単位履修が可能とした)。
学生が準備すべき機器他Equipment student needs to prepare
・講義内でデータ分析実習を行うため、演習室で講義を行う予定だが、遠隔での受講の場合には、ExcelおよびRが使える(かつZOOM で参加できる)PC 環境を用意すること。Rのインストール方法などは第一回目に解説する。
その他の重要事項Others
<講義について>
・2021 年度も場合によっては遠隔での講義となる回があることも想定される。その際には、ZOOM での遠隔講義となるため、各自、PC 環境を準備が必要となる点ご留意ください。
・なお、全回対面講義となった場合にも、遠隔参加のみでも単位取得ができることとする。
・PC演習(ExcelおよびR)を行うので、最低限のPC利用スキルは前提とする。
・Rの初学者は必ず第一回目を受講すること。
・学習支援システムを活用するので、操作方法を事前に確認しておくこと。
<教員について>
・「実務経験のある教員」か否かについて:担当する教員は、データ分析に関連した実務経験(シンクタンクでのリサーチやデータ分析、コンサルティングなど)があり、単に知識としてのデータ分析ではなく、実際に使える知識としてのデータ分析を解説する。