過去の講座
2005年度:音声認識・音声対話技術
音声認識に関する技術は近年めざましい進歩を遂げ、人間と音声で対話を行うシステム(エージェントやロボットを含む)の実現も可能になってきました。
本講習会は、10年近くの伝統がある音声認識の基礎からディクテーションまでカバーする講習会に加えて、音声対話技術コンソーシアム(ISTC)の発足に伴って、音声合成・顔画像合成・対話システムなどの項目を追加したものです。
前半の音声認識の部では、音声認識の基礎理論の講義に加えて、Juliusに代表される標準的なオープンソースのソフトウェアを用いて、ディクテーションシステムの演習を行います。
後半の音声対話技術の部では、音声合成や対話などに関する講義に加えて、Galatea Toolkitを用いて、「自分の顔で自分の声で話す」エージェントの作成を目指します。
企画・運営担当:河原達也(京都大学)
| 日時 |
平成17年8月22日(月)-26日(金) |
| 会場 |
京都大学 学術情報メディアセンター 南館
会場案内 |
| 定員 |
70名※受講受付は終了致しました |
| 参加費 |
テキスト代(実費): 3500円,懇親会費(予定): 2000円(22日), 4000円(25日)
(ただしISTC一般会員の機関は3名まで上記無料) |
| 主催 |
京都大学 学術情報メディアセンター
情報処理学会 音声言語情報処理研究会 音声対話技術コンソーシアム(ISTC) |
| 協賛 |
文部科学省リーディングプロジェクト e-Society基盤ソフトウェア |
音声認識:プログラム
グループ1:22日−24日( 9:30−16:10)
グループ2:22日−24日(11:30−18:10)
※懇親会: 22日(18:30−20:30)
より詳細なスケジュールはこちらのPDFファイルでご確認ください。
1:音声認識の概要・音声の入力と分析
| 講義 |
河原達也(京大) |
| 実習 |
西浦敬信(立命館大) |
2:HMMによる音響モデル
| 講義 |
篠田浩一(東工大) |
| 実習 |
南條浩輝(龍谷大) |
3:ネットワーク文法による認識
| 講義 |
伊藤克亘(名大) |
| 実習 |
駒谷和範(京大) |
4:形態素解析・N-gram言語モデル
| 講義 |
伊藤彰則(東北大) |
| 実習 |
秋田祐哉(京大) |
5:Juliusによるディクテーション
| 講義 |
李 晃伸(名工大) |
| 実習 |
西村竜一(和歌山大) |
6:CSRC/ISTCソフトウェア及びWindows SAPI版
| 講義 |
河原達也(京大) |
| 実習 |
翠 輝久(京大) |
音声対話技術:プログラム
グループ1:25日−26日(9:00−14:50)
グループ2:25日−26日(9:00−16:40)
※懇親会: 25日(18:30−20:30)
7:音声合成 (音声合成・TTS概説、HMMによる音声合成)
| 講義 |
山下洋一(立命館大) |
| 実習 |
酒向慎司(東大) |
8:顔画像合成(対話エージェント生成、口形状の表現、表情の表現)
| 講義 |
森島繁生(早大) |
| 実習 |
四倉達夫(ATR) |
9:音声対話(対話管理、Voice XML概説、Galeteaの実装)
| 講義 |
荒木雅弘(京都工繊大) |
| 実習 |
西本卓也(東大) |
10:マルチモーダル対話(MMI)とシステム開発(MMIシステム、記述言語、プロトタイピングツール)
| 講義 |
新田恒雄(豊橋技科大) |
| 実習 |
桂田浩一(豊橋技科大) |
注意
- ISTC一般会員の機関(3名まで)及び、マルチメディア情報処理に従事する社会人(研究者・技術者)の方を優先して受け付けます。
- 原則として、各項目は90分の講義と120分の演習から構成されます。(一部例外あり)
- 前半だけ、後半だけでも受講できます。また後半のみの参加者でも実習6を受講できますので、その場合は申込み時に(要望欄にて)お知らせください。
- 前半及び後半の最後の実習は各自でノートPCを用意して頂くのが望ましいですが、聴講だけでも可能です。
- PCの要件: Windows XP搭載、メモリ256MB以上、グラフィックVRAM32MB以上、サウンド機能
前のページへ戻る