過去の講座

2006年度:音声認識・音声対話技術

音声認識に関する技術は近年めざましい進歩を遂げ、人間と音声で対話を行うシステム(エージェントやロボットを含む)の実現も可能になってきました。
本講習会は、約10年の伝統がある音声認識の基礎からディクテーションまでカバーする講習会に加えて、音声対話技術コンソーシアム(ISTC)の発足に伴って、音声合成・顔画像合成・対話システムなどの項目を追加したものです。

前半の音声認識の部では、音声認識の基礎理論の講義に加えて、Juliusに代表される標準的なオープンソースのソフトウェアを用いて、ディクテーションシステムの演習を行います。後半の音声対話技術の部では、音声合成や対話などに関する講義に加えて、Galatea Toolkitを用いて、「自分の顔で自分の声で話す」エージェントの作成を目指します。

企画・運営担当:河原達也(京都大学)
日時 平成18年8月28日(月)-9月1日(金)
会場 京都大学 学術情報メディアセンター 南館
(〒606-8501 京都市左京区吉田二本松町)
会場案内
定員 70名※受講受付は終了致しました
参加費 テキスト代(実費): 3500円,懇親会費(予定): 2000円(28日), 4000円(31日)
(ただしISTC一般会員の機関は3名まで上記無料)
主催 京都大学 学術情報メディアセンター
情報処理学会 音声言語情報処理研究会 音声対話技術コンソーシアム(ISTC)
協賛 文部科学省リーディングプロジェクト e-Society基盤ソフトウェアの総合開発

音声認識:プログラム

グループ1
・28日 [9:00−9:30:受付/9:30−18:10:講義・実習/18:30−20:30:懇親会]
・29日 [9:10−18:10:講義・実習]
・30日 [9:10−16:10:講義・実習/16:10−16:40:顔写真撮影(後半参加者のみ)]
グループ2
・28日 [11:00−11:30:受付/11:30−18:00:講義・実習/18:30−20:30:懇親会]
・29日 [9:00−17:40:講義・実習]
・30日 [9:10−18:10:講義・実習/18:10−18:40:顔写真撮影(後半参加者のみ)]

より詳細なスケジュールはこちらのPDFファイルでご確認ください。

1:音声認識の概要・音声の入力と分析
講義 河原達也(京大)
実習 西浦敬信(立命館大)
2:HMMによる音響モデル
講義 篠田浩一(東工大)
実習 南條浩輝(龍谷大)
3:ネットワーク文法による認識
講義 伊藤克亘(法政大)
実習 駒谷和範(京大)
4:形態素解析・N-gram言語モデル
講義 伊藤彰則(東北大)
実習 秋田祐哉(京大)
5:Juliusによるディクテーション
講義 李 晃伸(名工大)
実習 西村竜一(和歌山大)
6:CSRC/ISTCソフトウェア及びWindows SAPI版
講義 河原達也(京大)
実習 翠 輝久(京大)

音声対話技術:プログラム

グループ1
・31日 [9:00−18:10:講義・実習/18:30−20:30:懇親会]
・01日 [9:00−14:50:講義・実習]
グループ2
・31日 [9:10−18:10:講義・実習/18:30−20:30:懇親会]
・01日 [10:50−16:40:講義・実習]
7:音声合成 (音声合成・TTS概説、HMMによる音声合成)
講義 山下洋一(立命館大)
実習 酒向慎司(東大)
8:顔画像合成(対話エージェント生成、口形状の表現、表情の表現)
講義 森島繁生(早大)
実習 四倉達夫(ATR)
9:音声対話(対話管理、Voice XML概説、Galateaの実装)
講義 荒木雅弘(京都工繊大)
実習 酒向慎司(東大)
10:マルチモーダル対話(MMI)とシステム開発(MMIシステム、記述言語、プロトタイピングツール)
講義 新田恒雄(豊橋技科大)
実習 桂田浩一(豊橋技科大)

注意

お問い合わせ

河原達也(京都大学 学術情報メディアセンター)
E-mail: seminarar.media.kyoto-u.ac.jp 迷惑メール防止の為「@」を画像で表示しています.

前のページへ戻る

このページの先頭へ