情報科学研究科Graduate School of Computer and Information Sciences
COT500K1(計算基盤 / Computing technologies 500)情報科学特別講義6(テキストマイニング特論)Special Lecture for Computer and Information Sciences 6(Text Mining)
横野 光Hikaru YOKONO
授業コードなどClass code etc
学部・研究科Faculty/Graduate school | 情報科学研究科Graduate School of Computer and Information Sciences |
添付ファイル名Attached documents | |
年度Year | 2024 |
授業コードClass code | TZ021 |
旧授業コードPrevious Class code | |
旧科目名Previous Class title | |
開講時期Term | 秋学期授業/Fall |
曜日・時限Day/Period | 月5/Mon.5 |
科目種別Class Type | |
キャンパスCampus | 小金井 |
教室名称Classroom name | 各学部・研究科等の時間割等で確認 |
配当年次Grade | |
単位数Credit(s) | 2 |
備考(履修条件等)Notes | |
実務経験のある教員による授業科目Class taught by instructors with practical experience | |
カテゴリーCategory |
すべて開くShow all
すべて閉じるHide All
Outline (in English)
It is much in demand to get findings from huge data. Text data reflects human's behavior or opinion and it has attracted attention as important sources. However, there are many expressions for one meaning and it is important to extract necessary information. Objectives of this class are to understand text analysis techniques using for text mining and to learn how to use natural language tools.
授業で使用する言語Default language used in class
日本語 / Japanese
授業の概要と目的(何を学ぶか)Outline and objectives
大量データからの情報分析技術は情報が爆発的に増大している近年において需要が大きい。特にテキストは人間の複雑な行動を反映した重要なデータとして注目されているが、構造化されたデータとは異なりテキストでは同じ内容が様々な言語表現として表れるため、必要な情報を抽出するということが必要になる。本講義ではテキストの解析に必要な自然言語処理を中心としたテキストマイニングで用いられる技術と、実際の応用的な場面においてそれらをどのように用いるかについての理解を目指す。
到達目標Goal
テキストマイニングは応用を指向した分野であり、必ずしも教科書的な手法があるわけではない。そのため、課題に応じて適切な解決法をみつけるための基礎と考え方を身につけ、産業・学術問わず即座に応用できる実践的な能力を養うことが目標である。実データを用いたレポート課題等を通して言語処理およびテキストマイニングの基礎的な技術を習得するとともに、そのようなテキストデータを対象にした処理において実応用の際に留意すべき点を理解することを目標とする。
この授業を履修することで学部等のディプロマポリシーに示されたどの能力を習得することができるか(該当授業科目と学位授与方針に明示された学習成果との関連)Which item of the diploma policy will be obtained by taking this class?
ディプロマポリシーのうち、「DP1」と「DP2」に関連
授業で使用する言語Default language used in class
日本語 / Japanese
授業の進め方と方法Method(s)(学期の途中で変更になる場合には、別途提示します。 /If the Method(s) is changed, we will announce the details of any changes. )
産業界での具体的な課題事例や研究テーマから最新のものをいくつか紹介し、それぞれの課題の解決法を考えることを通じて、テキストマイニングに必要な自然言語処理や機械学習などの基礎的な技術・理論とその応用について解説する。また、そうした既存技術を自ら選択して利用できるようにするため、ツールやライブラリを用いた演習をレポート課題として出題する。課題のフィードバックとして提出後の講義において実例を示しながら解説を行う。
なお、内容や進度については受講者の興味や理解度に応じて柔軟に対応する。
アクティブラーニング(グループディスカッション、ディベート等)の実施Active learning in class (Group discussion, Debate.etc.)
あり / Yes
フィールドワーク(学外での実習等)の実施Fieldwork in class
なし / No
授業計画Schedule
授業形態/methods of teaching:対面/face to face
※各回の授業形態は予定です。教員の指示に従ってください。
1[対面/face to face]:概要と導入
授業全体の紹介
2[対面/face to face]:自然言語処理
語の扱いについて・形態素解析
3[対面/face to face]:自然言語処理
構文解析
4[対面/face to face]:自然言語処理
意味解析
5[対面/face to face]:自然言語処理
ニューラル自然言語処理
6[対面/face to face]:テキストマイニング
テキストマイニングの基礎
7[対面/face to face]:テキストマイニング
固有表現認識・関係抽出
8[対面/face to face]:テキストマイニング
コーパスとアノテーション
9[対面/face to face]:テキストマイニング
クラスタリング
10[対面/face to face]:テキストマイニング
可視化技術
11[対面/face to face]:テキストマイニング
テキストデータの前処理
12[対面/face to face]:テキストマイニング
ソーシャルメディアを対象としたテキストマイニング
13[対面/face to face]:テキストマイニング
経済テキストを対象としたテキストマイニング
14[対面/face to face]:テキストマイニング
まとめと振り返り
授業時間外の学習(準備学習・復習・宿題等)Work to be done outside of class (preparation, etc.)
授業中に紹介したトピックから、興味のあるものを自分から掘り下げて学習する。
紹介したツールなどを実際に使用し、どのような出力が得られるかを確認する。特に使用するツールがよく誤る入力にはどのようなものがあるかを理解する。
本授業の準備・復習等の授業時間外学習は,各週につき4時間を標準とする。
テキスト(教科書)Textbooks
使用しない(講義資料は学習支援システムから受講者に公開する)。
参考書References
関連文献やウェブサイトは授業中に紹介する。
成績評価の方法と基準Grading criteria
平常点65%,レポート課題35%として評価する。
学生の意見等からの気づきChanges following student comments
特になし
学生が準備すべき機器他Equipment student needs to prepare
インターネットに接続できるPCを用意すること。講義資料配布・課題提出には学習支援システムを利用する。講義内で紹介するツールの多くはlinux環境での実行が想定されており、それらを用いる演習においてはGoogle Colaboratoryを利用する。
その他の重要事項Others
実用的でありながら基礎と考え方を身につけられるような楽しい授業にしていきたいと考えている。講義時間中に多くのことを学べるよう、受講者には授業への積極的な参加を求める。