情報科学研究科Graduate School of Computer and Information Sciences
HUI500K1(人間情報学 / Human informatics 500)情報科学特別講義5(音声・音楽処理特論)Special Lecture for Computer and Information Sciences 5(Voice and Acoustics)
北原 義典Yoshinori KITAHARA
授業コードなどClass code etc
学部・研究科Faculty/Graduate school | 情報科学研究科Graduate School of Computer and Information Sciences |
添付ファイル名Attached documents | |
年度Year | 2024 |
授業コードClass code | TZ020 |
旧授業コードPrevious Class code | |
旧科目名Previous Class title | |
開講時期Term | 春学期授業/Spring |
曜日・時限Day/Period | 木3/Thu.3 |
科目種別Class Type | |
キャンパスCampus | 小金井 |
教室名称Classroom name | 各学部・研究科等の時間割等で確認 |
配当年次Grade | |
単位数Credit(s) | 2 |
備考(履修条件等)Notes | |
実務経験のある教員による授業科目Class taught by instructors with practical experience | |
カテゴリーCategory |
すべて開くShow all
すべて閉じるHide All
Outline (in English)
We learn characteristics of auditory media such as speech and music, and methods of speech information processing by computer. In addition, we also learn the importance of speech communication and its skills. The goals are to learn the basics of speech and signal processing including the technique of the speech recognition and synthesis, principle of processing technique of music and human communication skills. Read a text and a reference book, and be interested in a sound, a voice and words, way of speaking usually. In addition, this class assumes four hours as standard home work time in each week. I evaluate you as the total of term-end examination score (80 points) and usual lecture approach posture (20 points). I assume higher than 60 points of evaluation points a pass.
授業で使用する言語Default language used in class
日本語 / Japanese
授業の概要と目的(何を学ぶか)Outline and objectives
本講義は、音声・音楽等、聴覚メディアのもつ特性、および、コンピュータによるこれらの情報処理の手法について学習し、併せて音声コミュニケーションの重要性及びスキルも習得することを目的とする。
到達目標Goal
(1)音声に関する基本的性質を知る
(2)音声信号処理の基礎を身につける
(3)音声認識、音声合成の原理と処理手法を習得する
(4)音楽認識、自動作曲の原理と処理手法を習得する
(5)説得性の高いコミュニケーションの構造とスキルを習得する。
この授業を履修することで学部等のディプロマポリシーに示されたどの能力を習得することができるか(該当授業科目と学位授与方針に明示された学習成果との関連)Which item of the diploma policy will be obtained by taking this class?
ディプロマポリシーのうち、「DP1」と「DP2」に関連
授業で使用する言語Default language used in class
日本語 / Japanese
授業の進め方と方法Method(s)(学期の途中で変更になる場合には、別途提示します。 /If the Method(s) is changed, we will announce the details of any changes. )
音声を中心とした聴覚メディアについて、生理学的見地、言語学的見地、信号処理論的見地、心理学的見地から、実験も交えながら多角的に学習する。その後、音声認識、音声合成、音楽自動作曲等の具体的処理方法論について学ぶ。さらに、説得性の高いコミュニケーションスキルを身につける演習も行う。各回事前課題を課し、授業の初めに、課題に対する解答例を示しフィードバックを行う。また、良い回答やコメントは授業内で紹介する。本年度については、感染防止対策を施した講義室での対面講義を基本とする。ただし大学からの通達でオンライン講義実施の指示があった場合はZoomにより講義を行う。詳細は学習支援システムにアクセスし確認のこと。
アクティブラーニング(グループディスカッション、ディベート等)の実施Active learning in class (Group discussion, Debate.etc.)
あり / Yes
フィールドワーク(学外での実習等)の実施Fieldwork in class
なし / No
授業計画Schedule
授業形態/methods of teaching:対面/face to face
※各回の授業形態は予定です。教員の指示に従ってください。
1[対面/face to face]:メディアの分類と聴覚メディアの特性
音声、画像、文字をはじめとするメディアの分類とメディア処理の概要、さらに人間の感覚の分類やそれぞれの特性、および、聴覚メディアの特性について学ぶ。
2[対面/face to face]:発声機構と聴覚機構
発声機構および聴覚機構の生理学的基礎、さらに、調音方式と位置、音韻の種類について学ぶ。
3[対面/face to face]:音声を見る
音声の観察の方法について知る。さらに、音声のデジタル化、サンプリング定理などについて学ぶ。
4[対面/face to face]:音声波形の性質
波形分析により、音声の韻律的性質や韻律パラメータの抽出方法を習得する。
5[対面/face to face]:音声スペクトル
スペクトルの概念、フーリエ変換を用いた音声のスペクトル分析手法を基礎から学ぶ。また、スペクトルの見方を知る。
6[対面/face to face]:音声言語の類型と単位
音声を言語的側面からみる。言語の分類、音声言語の言語学的単位、音声学的単位について知る。
7[対面/face to face]:音声言語の性質
共通語の特徴としての、アクセント、イントネーション、母音の無声化、鼻濁音化について学ぶ。
8[対面/face to face]:音声認識処理
音声認識技術の分類、手順について学び、音響特徴量の抽出、照合方法を習得する。
9[対面/face to face]:音声処理とAI
機械学習を用いた音声認識手法や、スマートスピーカなどAIアシスタントの原理を学ぶ。
10[対面/face to face]:音声合成処理
音声合成の音響処理、音質評価の手法を習得する。また、動向や今後の方向を学ぶ。
11[対面/face to face]:論理的に話す
ビジネス・学究場面において欠かせない論理性とは何かを知り、論理的に考え話すスキルを身につける。
12[対面/face to face]:ヒューマンコミュニケーションの構造
人間同士のコミュニケーションにおいて働く力学と効果的なコミュニケーションのスキルについて学ぶ。
13[対面/face to face]:音楽情報処理・音のデザイン
音楽の基本要素、音楽情報処理技術の分類、音楽認識・自動作曲の方法について学ぶ。サウンドスケープの概念とそのデザインについて、また、産業場面における音環境や効果を知る。
14[対面/face to face]:音声音響情報処理の課題とまとめ
音声の信号処理、言語処理、音声認識、音声合成の課題や、コミュニケーション手法のあり方について、まとめる。併せて講義の理解度チェックも行う。
授業時間外の学習(準備学習・復習・宿題等)Work to be done outside of class (preparation, etc.)
日頃から配布テキストや参考図書を読んだり、音、人の声や言葉、しゃべり方に興味をもつよう心掛けてください。なお、本講義の準備・復習等の授業時間外学習は,各週につき4時間を標準とします。
テキスト(教科書)Textbooks
授業支援システムにアップロードしたテキスト
参考書References
北原「なぜ、口べたなあの人が、相手の心を動かすのか?」講談社 プラスアルファ新書
北原「イラストで学ぶヒューマンインタフェース」講談社
成績評価の方法と基準Grading criteria
(1)音声に関する基本的性質
(2)音声信号処理の基礎
(3)音声認識、音声合成の原理と処理手法
(4)音楽認識、自動作曲の原理と処理手法
(5)説得性の高いコミュニケーションスキル
の習得度に関する期末試験点数(80点)と平常の講義取り組み姿勢(20点)の合計をもって評価点とする。授業の取り組み姿勢とは、主に授業中の発言の活発さを指す。合計評価点60点以上を合格とする。
学生の意見等からの気づきChanges following student comments
学生授業アンケートでは、知覚実験や音声合成のデモンストレーション、考えさせる問題が好評で、引き続き、さまざまな実験を行ないながら講義を進め、受講者にとって「思考する」かつ「楽しめる」授業にしていきたい。
学生が準備すべき機器他Equipment student needs to prepare
本年度、基本は対面講義ですが、全学的にオンライン講義を実施する旨の通達があった場合は、Zoomを利用するため、PCもしくはスマートフォンを準備し、開講日にアクセス、入室してください。また、連絡事項や配布テキストは学習支援システムにアクセスし確認のこと。
その他の重要事項Others
本講義の担当教員は、㈱日立製作所の中央研究所にて33年の音声研究の実務経験がある。その経験を活かし、理論だけでなく、ビジネスに向けた音声製品開発の話やデモンストレーションなどを織り込んでいく。