「メディア情報処理専修コース」過去の講座>2005年度：音声認識・音声対話技術

TOP 過去の講座音声認識・音声対話技術

過去の講座

音声認識に関する技術は近年めざましい進歩を遂げ、人間と音声で対話を行うシステム(エージェントやロボットを含む)の実現も可能になってきました。

本講習会は、10年近くの伝統がある音声認識の基礎からディクテーションまでカバーする講習会に加えて、音声対話技術コンソーシアム(ISTC)の発足に伴って、音声合成・顔画像合成・対話システムなどの項目を追加したものです。

前半の音声認識の部では、音声認識の基礎理論の講義に加えて、Juliusに代表される標準的なオープンソースのソフトウェアを用いて、ディクテーションシステムの演習を行います。

後半の音声対話技術の部では、音声合成や対話などに関する講義に加えて、Galatea Toolkitを用いて、「自分の顔で自分の声で話す」エージェントの作成を目指します。

日時	平成17年8月22日（月）－26日（金）
会場	京都大学学術情報メディアセンター　南館会場案内
定員	70名※受講受付は終了致しました
参加費	テキスト代（実費）: 3500円，懇親会費（予定）: 2000円(22日), 4000円(25日) （ただしISTC一般会員の機関は3名まで上記無料）
主催	京都大学　学術情報メディアセンター情報処理学会　音声言語情報処理研究会　音声対話技術コンソーシアム(ISTC)
協賛	文部科学省リーディングプロジェクト　e-Society基盤ソフトウェア

グループ１：22日−24日（ 9:30−16:10）
グループ２：22日−24日（11:30−18:10）
※懇親会：　22日（18:30−20:30）

より詳細なスケジュールはこちらのPDFファイルでご確認ください。

1：音声認識の概要・音声の入力と分析
講義	河原達也（京大）
実習	西浦敬信（立命館大）

2：HMMによる音響モデル
講義	篠田浩一（東工大）
実習	南條浩輝（龍谷大）

3：ネットワーク文法による認識
講義	伊藤克亘（名大）
実習	駒谷和範（京大）

4：形態素解析・N-gram言語モデル
講義	伊藤彰則（東北大）
実習	秋田祐哉（京大）

5：Juliusによるディクテーション
講義	李　晃伸（名工大）
実習	西村竜一（和歌山大）

6：CSRC/ISTCソフトウェア及びWindows SAPI版
講義	河原達也（京大）
実習	翠輝久（京大）

グループ１：25日−26日（9:00−14:50）
グループ２：25日−26日（9:00−16:40）
※懇親会：　25日（18:30−20:30）

7：音声合成（音声合成・TTS概説、HMMによる音声合成）
講義	山下洋一（立命館大）
実習	酒向慎司（東大）

8：顔画像合成（対話エージェント生成、口形状の表現、表情の表現）
講義	森島繁生（早大）
実習	四倉達夫（ATR）

9：音声対話（対話管理、Voice XML概説、Galeteaの実装）
講義	荒木雅弘（京都工繊大）
実習	西本卓也（東大）

10：マルチモーダル対話(MMI)とシステム開発（MMIシステム、記述言語、プロトタイピングツール）
講義	新田恒雄（豊橋技科大）
実習	桂田浩一（豊橋技科大）