情報科学部Faculty of Computer and Information Sciences
COT311KA-CS-262(計算基盤 / Computing technologies 300)情報検索Information Retrieval
相島 健助Kensuke AISHIMA
授業コードなどClass code etc
学部・研究科Faculty/Graduate school | 情報科学部Faculty of Computer and Information Sciences |
添付ファイル名Attached documents | |
年度Year | 2022 |
授業コードClass code | J0546 |
旧授業コードPrevious Class code | |
旧科目名Previous Class title | |
開講時期Term | 秋学期授業/Fall |
曜日・時限Day/Period | 火5/Tue.5 |
科目種別Class Type | |
キャンパスCampus | 小金井 / Koganei |
教室名称Classroom name | 各学部・研究科等の時間割等で確認 |
配当年次Grade | |
単位数Credit(s) | 2 |
備考(履修条件等)Notes | |
他学部公開科目Open Program | |
他学部公開(履修条件等)Open Program (Notes) | |
グローバル・オープン科目Global Open Program | |
成績優秀者の他学部科目履修制度対象Interdepartmental class taking system for Academic Achievers | ○ |
成績優秀者の他学部科目履修(履修条件等)Interdepartmental class taking system for Academic Achievers (Notes) |
(1) 受講希望者 (受講検討中の者も含む) は、情報科学部学部Googleフォーム(https://forms.gle/ECvwxVe2NcxmrbTK9)で初回講義前までに希望申請をしてください。(※以下URLのご案内があるGoogleフォームとは異なるのでご注意ください。) (2) 以下のURLと教育開発支援機構事務局の案内に従って、履修希望の申請を行ってください。 https://www.hoseikyoiku.jp/risyu/index.html (3) 履修取消については、ご自身の所属学部の履修取消期間内に必ず同時に履修削除を行ってください。 |
実務経験のある教員による授業科目Class taught by instructors with practical experience | |
SDGsCPSDGs CP | |
アーバンデザインCPUrban Design CP | |
ダイバーシティCPDiversity CP | |
未来教室CPLearning for the Future CP | |
カーボンニュートラルCPCarbon Neutral CP | |
千代田コンソ単位互換提供(他大学向け)Chiyoda Campus Consortium | |
選択・必修Optional/Compulsory | |
カテゴリー(2022年度以降入学者)Category (2022~) | |
カテゴリー(2021年度以前入学者)Category (~2021) | |
カテゴリーCategory |
専門教育科目 専門科目 |
すべて開くShow all
すべて閉じるHide All
Outline (in English)
This course covers algorithms, techniques, and evaluation methods for information retrieval. The information retrieval is a fundamental technique to search engines such as google, which is one of the most important techniques in current information applications. Since this kind of technique is based on full-text search, it is now successfully applied to other content-based searching. The purpose of this course is to understand mathematical aspects of the information retrieval. In addition, this course covers more advanced contents such as recommender systems.
Before/after each class meeting, students will be expected to spend four hours to understand the course content.
Grading will be decided based on term-end examination (60%) and lab reports (40%).
授業で使用する言語Default language used in class
日本語 / Japanese
授業の概要と目的(何を学ぶか)Outline and objectives
情報検索の基盤となるアルゴリズム、手法、評価方法を理解することを目標とする。情報検索とは、google などの検索サービスの根幹となる技術であり、現在の情報アプリケーションの中で最も重要な技術の一つである。この技術は、全文検索と呼ばれる技術を基盤とし、様々な技術を加えて進歩してきた。本講義では、それらのうち中心的な技術の数理的な意味を理解することを目標とする。また、リコメンデーションなどの応用的な話題も紹介する。
到達目標Goal
単に google などのしくみを理解するだけでなく、大量のテキスト情報を扱うアプリケーションを扱うための基本スキルを身に付ける。
この授業を履修することで学部等のディプロマポリシーに示されたどの能力を習得することができるか(該当授業科目と学位授与方針に明示された学習成果との関連)Which item of the diploma policy will be obtained by taking this class?
ディプロマポリシーのうち「DP4-3」に関連
授業で使用する言語Default language used in class
日本語 / Japanese
授業の進め方と方法Method(s)(学期の途中で変更になる場合には、別途提示します。 /If the Method(s) is changed, we will announce the details of any changes. )
卒業研究などで実践的に役立つ技能の習得のために、取り上げる手法は、実際のデータが処理できる簡単なプログラミング例と関連付けて学びます。紹介する手法を簡単に実行するために、MATLABなどのプラットフォームや java のライブラリなどを利用します。演習課題を通して、処理手法の基礎を身に付けることを目標とします。課題(試験やレポート等)に対するフィードバック方法として、授業の初めに、前回の授業内で行った試験や小レポート等、課題からいくつか取り上げ、全体に対して講評や解説を行う。
アクティブラーニング(グループディスカッション、ディベート等)の実施Active learning in class (Group discussion, Debate.etc.)
あり / Yes
フィールドワーク(学外での実習等)の実施Fieldwork in class
なし / No
授業計画Schedule
授業形態/methods of teaching:対面/face to face
※各回の授業形態は予定です。教員の指示に従ってください。
1[対面/face to face]:ガイダンス
この講義の意義とどのような内容をカバーするかを説明します。
2[対面/face to face]:情報検索概論
情報検索とは何かについて学びます。
3[対面/face to face]:検索キーワードと索引付け
情報検索に利用する検索キーワードの選定方法と、それを用いて、文書を索引付けする方法を学びます。
4[対面/face to face]:キーワードのスコア
検索キーワードのスコア付けの方法として TF/IDF 法などを学びます。
5[対面/face to face]:検索結果の改善法
検索結果の改善方法として、関連性フィードバックやクエリ拡張について学びます。
6[対面/face to face]:文書の信頼性尺度
文書の信頼性尺度として Pagerank について学びます。
7[対面/face to face]:簡単な検索演習
これまでに学んだことを実際にプログラミングする演習を行います。
8[対面/face to face]:画像の検索
画像検索の現状について説明します。残念ながら、純粋に画像の性質を使った検索ではなく、周囲の文字情報が用いられているようです。講義では、画像それ自体の情報を用いて検索をする場合に、利用可能な特徴量について説明します。それにより、画像間の類似度を定義します。
9[対面/face to face]:検索結果の評価
検索結果の評価尺度や評価方法について学びます。
10[対面/face to face]:商品の類似性、利用者の類似性
利用者の嗜好情報、購買履歴などのデータから、商品の類似性、利用者の類似性を計算する方法を理解します。
11[対面/face to face]:リコメンデーション
商品や利用者の類似性に基づき、利用者にリコメンドする商品を決定する方法を学びます。
12[対面/face to face]:クラスタリング
大量の多次元のベクトルであらわされた利用者の嗜好情報から、似た嗜好をもつグループをクラスタ化する方法を学びます。
13[対面/face to face]:XMLストリームデータ検索
インターネット情報を連続的に流れるXMLデータから、必要なデータだけを抽出する方法について学びます。
14[対面/face to face]:まとめ
課題の講評などを行います
授業時間外の学習(準備学習・復習・宿題等)Work to be done outside of class (preparation, etc.)
授業内容に関する課題を復習として出題する。本授業の準備・復習等の授業時間外学習は、各週につき4時間を標準とします。
テキスト(教科書)Textbooks
なし。
参考書References
書名: Introduction to Information Retrieval
著者名: Christopher D. Manning/Prabhakar Raghavan/Hinrich Schütze
出版社: Cambridge University Press
出版年: 2008
備考: http://nlp.stanford.edu/IR-book/information-retrieval-book.html で内容をみることができる。
日本語版は「情報検索の基礎」(共立出版)
書名: 集合知プログラミング
著者名: Toby Segaran
出版社: オライリー・ジャパン
出版年: 2008
成績評価の方法と基準Grading criteria
定期試験の点数(60%)と課題(40%)を総合して決定する。いずれかを行わなかったものは不合格とする。
学生の意見等からの気づきChanges following student comments
難しい概念が多いため,説明のための具体例や演習の例題を多く示すことにする.
学生が準備すべき機器他Equipment student needs to prepare
ノートPCを用いて演習を行う。学習支援システムを利用する。
その他の重要事項Others
「統計学1」(旧カリキュラムの「確率と統計」でもよい)、「線形代数の応用2」を履修しておくこと。