研究プロジェクト

人間の知の創造・伝達の多くは、音声によるコミュニケーションによって行われています。 本分野では、人間どうしがやりとりを行う音声メディアを分析し、自動認識・理解した上で、インタラクションを行えるシステムの実現をめざします。 具体的には、会議や講演のような自然な話し言葉音声をテキスト化するシステム、複数の話者や音源などからなる音環境や音楽を解析するシステム、非言語情報も統合しながら自然な対話が行える人間型ロボットなどの研究に取り組みます。

 

話し言葉の音声認識

  • 音声認識技術の変遷と最先端...日本音響学会誌2018年7月号 (PDFファイル)
  • 音声認識による講演・講義の字幕付与...日本音響学会誌2018年3月号 (PDFファイル)

ロボットとの音声対話・インタラクション

  • 音声対話システムの進化と淘汰...人工知能学会研究会資料 SLUD-B203-02 (2013年) (PDFファイル)
  • 話し言葉による音声対話システム...情報処理学会誌2004年10月号 (PDFファイル)

音楽情報処理・音楽ロボット

  • 音楽と機械学習...情報処理学会誌2016年6月号 (PDFファイル)
  • 音楽と統計的記号処理...映像情報メディア学会誌2017年7月号 (PDFファイル)

音環境理解・統計的音響信号処理

  • スマートポスターボード...人工知能学会研究会資料, Challenge-B303-1 (2014年) (PDFファイル)
  • 音楽音響信号解析のためのスパース学習...電子情報通信学会誌2016年5月号 (PDFファイル)

メディア処理技術を用いた語学学習支援(CALL)

  • 音声情報処理技術を用いた外国語学習支援...電子情報通信学会論文誌2013年7月号 (PDFファイル)