イノベーション・マネジメント研究科Business School of Innovation Management
MAN510F2(経営学 / Management 500)データマイニングData Mining
豊田 裕貴Yuki TOYODA
授業コードなどClass code etc
学部・研究科Faculty/Graduate school | イノベーション・マネジメント研究科Business School of Innovation Management |
添付ファイル名Attached documents | |
年度Year | 2023 |
授業コードClass code | W0304 |
旧授業コードPrevious Class code | |
旧科目名Previous Class title | |
開講時期Term | 秋学期前半/Fall(1st half) |
曜日・時限Day/Period | 水6/Wed.6,水7/Wed.7 |
科目種別Class Type | 専門講義 |
キャンパスCampus | 市ヶ谷 |
教室名称Classroom name | 各学部・研究科等の時間割等で確認 |
配当年次Grade | 1・2 |
単位数Credit(s) | 2 |
備考(履修条件等)Notes | 専門科目 |
実務経験のある教員による授業科目Class taught by instructors with practical experience | ○ |
カテゴリーCategory | 専門科目 |
すべて開くShow all
すべて閉じるHide All
Outline (in English)
In this lecture, we think that data mining is a method to derive findings that contribute to business from data. Therefore, we will learn with the emphasis on what kind of data is applied to what kind of data as a tool, and how to use the result for business.
授業で使用する言語Default language used in class
日本語 / Japanese
授業の概要と目的(何を学ぶか)Outline and objectives
ビジネスでのデータ活用が期待されている反面、まだまだ十分に活用しきれていない状況がある。その一因としてデータ分析手法がExcelでできることのみに留まってしまっている点が挙げられる。そこで、Excelでできることを超えて、より積極的なビジネスデータ活用をデータマイニングという領域に広げ、学習する。その際、フリーソフトでありデータ分析に特化したR言語を活用し、より高度な手法を活用し、ビジネスデータから知見を導き出す(マイニングする)方法を学習するのが、本講義の目的である。
なお、本講義では、データマイニングをあくまでデータからビジネスに資する知見を導き出す手法群であると考え、数学的な解説よりは、道具としてどんなデータにどんな手法を適用し、その結果をどうビジネスに活用するかに力点を置いて学習していくこととする。
到達目標Goal
学習する手法について、各自のテーマに応用できることを目指す。その際、手法の仕組みについてある程度理解し、どんなデータにどんな手法を行うと何が明らかになるのかについて理解し、手法を活用できるよう担うことも目指す。
なお、Rについては、ゼロからスクリプトを書くのではなく、サンプルスクリプトを必要に応じて修正しながら使うことが出来るようになることを目指す。そのことによって、WEB上に公開されている無数のライブラリーやスクリプトを活用できるようになることを目標とする。繰り返しになるが、本講義は数学としてデータマイニングを学ぶ講義ではなく、あくまでどのようにビジネスに活用するかを考えられる力を身につけることが目標となる。
この授業を履修することで学部等のディプロマポリシーに示されたどの能力を習得することができるか(該当授業科目と学位授与方針に明示された学習成果との関連)Which item of the diploma policy will be obtained by taking this class?
イノベーション・マネジメント研究科のディプロマポリシーのうち、「DP2」「DP3」に関連
授業で使用する言語Default language used in class
日本語 / Japanese
授業の進め方と方法Method(s)(学期の途中で変更になる場合には、別途提示します。 /If the Method(s) is changed, we will announce the details of any changes. )
講義では、手法の解説をしたうえで、実際に各自がRでデータを分析し、その結果を解釈するというスタイルをとる。Rについては、ビジネスデータ分析アドバンスで学習するため、この講義では、ゼロから解説することはしないため、注意すること(ビジネスデータ分析アドバンスの受講を必須とはしていないが、Rが使える前提で講義になることに注意。ビジネスデータ分析アドバンスはe-learningでも学習するため、データマイニングに先んじて、ビジネスデータ分析アドバンスの受講を強く推奨する)。
アクティブラーニング(グループディスカッション、ディベート等)の実施Active learning in class (Group discussion, Debate.etc.)
あり / Yes
フィールドワーク(学外での実習等)の実施Fieldwork in class
なし / No
授業計画Schedule
授業形態/methods of teaching:対面/face to face
※各回の授業形態は予定です。教員の指示に従ってください。
1-2講[対面/face to face]:yが量的変数のマイニング
関係性の分析として、y(結果系変数)が量的変数の分析(マイニング)を学習する。具体的には、回帰分析および決定木について学習し、ビジネスに生かす方法を考える。
3-4講[対面/face to face]:yが質的変数のマイニング
関係性の分析として、y(結果系変数)が質的変数の分析(マイニング)を学習する。具体的には、ロジスティック回帰分析および決定木について学習し、ビジネスに生かす方法を考える。
5-6講[対面/face to face]:多択のyのマイニング+アンサンブル学習
RandomForest の活用~
決定木の応用としてRandam Forestというアンサンブル学習手法を学習する。加えて、過学習というデータマイニングで重要なポイントについても学習する。
7-8講[対面/face to face]:アソシエーションルール分析
何を買った人は他に何を買うかというようなルール抽出の手法として「アソシエーションルール分析(マーケットバスケット分析)」を学習する。
9-10講[対面/face to face]:レコメンドエンジンの構築
マーケティングの分野では、顧客に適切な商品を推奨するためにデータを活用することが求められている。その方法として、協調フィルタリングを中心に、どのように推奨する仕組みを作るかについて学習する。
11-12講[対面/face to face]:テキストデータの分析
ビジネスでは分析するデータがテキスト(文字情報)の場合も少なくない。そこで、テキストデータの分析としてテキストマイニングの基礎について学習する。
13-14講[対面/face to face]:まとめ
ここまで学習してきた手法を組み合わせた活用方法や講義内に追加でリクエストされた手法の解説などを行う。
授業時間外の学習(準備学習・復習・宿題等)Work to be done outside of class (preparation, etc.)
本授業の準備学習・復習時間は、各2時間を標準とします。
必要に応じて分析手順などの動画をアップするので、予習・復習に活用し、実際に使える知識として手法を学習すること。
テキスト(教科書)Textbooks
特に指定なし
参考書References
・豊田裕貴(2017)『Rによるデータ駆動マーケティング』オーム社
・ブレット・ランツ(2017)『Rによる機械学習』翔泳社
・山本義郎、藤野友和、 久保田貴文 (2015)『Rによるデータマイニング』オーム社
※その他、随時紹介する。
成績評価の方法と基準Grading criteria
講義内課題ならびに普段の取り組み(20点)、期末レポート(80点)
学生の意見等からの気づきChanges following student comments
・多様な分野の院生の受講に応じるため、前提となる高度な数学やデータ分析の知識は設定せず基礎から解説する。ただし、ビジネスデータ分析(ベーシックおよびアドバンス)で解説される要約とモデル分析の基礎についてはある程度理解していることを前提として講義をする。
・したがって、ビジネスデータ分析(ベーシックおよびアドバンス)を合わせて受講することを強く推奨する。
・とくに分析ツールの「R」については、ビジネスデータ分析アドバンスで学習しているものとして解説し、ゼロからの解説にはならない点を留意すること。
学生が準備すべき機器他Equipment student needs to prepare
・講義内でデータ分析実習を行うため、各自、ExcelおよびRが使える(かつZOOM で参加できる)PC 環境を用意すること。Rについては、Rstudio Cloudにて演習を行う。
・対面講義を基本とするが、ハイフレックス形式で開講するため、遠隔での受講も可能。遠隔受講の場合には、マイクとカメラのある受講環境を準備すること。
その他の重要事項Others
<講義について>
・本講義では、Rというデータ分析ソフトを利用する。受講者の環境依存の問題を回避するため、Rstudio Cloudにて演習を行う。Rstudio Cloudの設定方法や基本的な使い方については、動画配信するので、確認の上、各自IDを取得すること。
・演習にて利用するR(Rstudio Cloud)については、ビジネスデータ分析アドバンスで学習する。Rについての知識がない場合には、ビジネスデータ分析アドバンスの受講すること。
<教員について>
・「実務経験のある教員」か否かについて:担当する教員は、データ分析に関連した実務経験(シンクタンクでのリサーチやデータ分析、コンサルティングなど)があり、単に知識としてのデータ分析ではなく、実際に使える知識としてのデータ分析を解説する。