第7回 音声言語シンポジウム

第59回 音声言語情報処理研究会 (SIG-SLP)

日時: 2005年12月21日(水)・22日(木)
場所: 東京工業大学 大岡山キャンパス 西9号館
    (東京都目黒区大岡山2-12-1, 東急目黒線・大井町線: 大岡山駅徒歩1分)     アクセス

主催: 電子情報通信学会および日本音響学会 音声(SP)研究会
    情報処理学会 音声言語情報処理(SLP)研究会
    電子情報通信学会 言語理解とコミュニケーション(NLC)研究会

協賛: 人工知能学会 言語・音声理解と対話処理(SLUD)研究会
    IEEE Signal Processing Society Japan Chapter

参加費(資料代):
   研究会登録会員             : 無料
   情報処理学会学生会員を除く個人、賛助会員:2,000円
   情報処理学会学生会員          : 500円
   非会員                 :3,000円

概 要:
21日午前  9:20 - 12:00
  【Session-1 音響モデル・特徴量・学習】
21日午後前半 13:00 - 15:25
  【Session-2 情報検索】
    〔招待講演〕映像情報検索技術の最前線
21日午後後半 15:35 - 18:25
  【Session-3 対話・コミュニケーション】
    〔招待講演〕対話におけるパラ言語情報による対人的反応の誘発
22日午前  9:20 - 12:00
  【Session-4 システム・言語モデル】
22日午後前半 13:00 - 15:35
  【Session-5】
    〔特別講演〕大語彙連続音声認識エンジン Julius の開発の進展
  【Session-6 スペシャルセッション:共通コーパスを利用した耐雑音技術評価】
    〔招待講演〕複数音声コーパスの俯瞰的分析
22日午後後半 15:45 - 18:00
  【Session-7 スペシャルセッション(ポスター):共通コーパスを利用した耐雑音技術評価】
  【Session-8 ポスターセッション:一般】


プログラム:

21日午前
【Session-1 音響モデル・特徴量・学習】9:20-11:00, 11:10-12:00

(1) マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討
	浅見 太一, 岩野 公司, 古井 貞煕 (東工大)

(2) Switching dynamical systemとパーティクルフィルタを用いた非定常雑音の逐次推定
	藤本 雅清, 中村 哲 (ATR)

(3) Evaluating Rapid Unsupervised Speaker Adaptation using Linear Interpolation of {HMM} Sufficient Statistics
	Randy Gomez, Tomoki Toda, Hiroshi Saruwatari, Kiyohiro Shikano (NAIST)

(4) {Online-EM}による語意学習機構と学習バイアスの適用
	田口 亮, 木村 優志, 篠原 修二, 桂田 浩一, 新田 恒雄 (豊橋技科大)

(5) 日本語話し言葉コーパスを用いた発音変形依存モデルによる講演音声認識の性能評価
	阿部 拓也, 草間 隆, 武田 千春, 加藤 正治, 小坂 哲夫, 好田 正紀 (山形大)

(6) 実況・対談における発声変形を考慮した音響モデルの検討
	佐藤 庄衛, 尾上 和穂, 本間真一, 小林 彰夫, 今井 亨 (NHK技研)


21日午後
【Session-2 情報検索】13:00-14:00, 14:10-15:25

(7) 〔招待講演〕映像情報検索の最前線
	帆足 啓一郎 (KDDI研究所)

(8) セグメント高速探索法とその評価
	岡本 知子, 杉山 雅英 (会津大)

(9) {WEB}上の類似記事を利用した音声文書の認識性能の改善
	伊藤 友裕, 西崎 博光, 関口 芳廣 (山梨大)

(10) 単語の重要度を考慮したベイズリスク最小化音声認識とそれに基づく情報検索
	南條 浩輝 (龍谷大), 翠 輝久, 河原 達也 (京大)

【Session-3 対話・コミュニケーション】15:35-16:35, 16:45-18:25

(11) 〔招待講演〕対話におけるパラ言語的情報による対人的反応
	竹内 勇剛 (静岡大)

(12) 対話相手の音声の品質を考慮した対話状況での言語的・音響的特徴の分析および様々な観点からの考察
	山田 真也, 伊藤 俊彦, 荒木 健治 (北大)

(13) 対話構造木コーパスを用いた発話意図予測
	加藤 真吾, 松原 茂樹, 山口 由紀子, 河口 信夫 (名大)

(14) 対話音声を対象とした韻律情報による発話印象のモデル化
	西田 昌史, 小川 純平, 堀内 靖雄, 市川 熹 (千葉大)

(15) 多人数同時発話型チャットシステムを通した言語コミュニケーションの検討
	山田 祐士, 竹内 勇剛 (静岡大)


22日午前
【Session-4 システム・言語モデル】9:20-10:10, 10:20-12:00

(16) 超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討
	中川 竜太, 岩野 公司, 古井 貞煕 (東工大)

(17) 音声認識システム{SOLON}の日本語話し言葉コーパス(公開版Ver1.0)による評価
	中村 篤, 大庭 隆伸, 渡部 晋治, 石塚 健太郎, 堀 貴明, マイク シュスター, エリック マクダーモット, 南 泰浩 (NTT)

(18) 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張
	北村 任宏, 戸田 智基, 川波 弘道 (奈良先端大), 李 晃伸 (名工大), 猿渡 洋, 鹿野 清宏 (奈良先端大)

(19) 統計的機械翻訳の枠組みに基づく言語モデルの話し言葉スタイルへの変換
	秋田 祐哉, 河原 達也 (京大)

(20) 頑健な言語理解のための文法とワードスポッティングを併用した音声認識手法の検討
	鈴木 貞之, 小暮 悟, 伊藤 敏彦 (北大), 甲斐 充彦, 小西 達裕, 伊東 幸宏 (静岡大)

(21) 孤立単語認識と連続基本単語認識の併用に基づく組織名の音声入力インタフェース
	北岡 教英, 押川 洋徳, 中川 聖一 (豊橋技科大)


22日午後
【Session-5】13:00-14:00

(22) 〔特別講演〕大語彙連続音声認識エンジン{Julius}の開発の進展
	李 晃伸 (名工大)

【Session-6 スペシャルセッション:共通コーパスを利用した耐雑音技術評価】14:10-15:35

(23) 〔招待講演〕複数音声コーパスの俯瞰的分析
	庄境 誠 (旭化成)

(24) SLP雑音下音声認識評価WG活動報告 --評価用データと評価手法について--
	中村 哲 (ATR), 武田 一哉 (名大), 黒岩 眞吾 (徳島大), 北岡 教英 (豊橋技科大), 山田 武志 (筑波大), 山本 一公 (信州大), 西浦 敬信 (立命館大), 佐宗 晃 (産総研), 水町 光徳 (九工大), 宮島 千代美 (名大), 藤本 雅清, 遠藤 俊樹 (ATR), 滝口 哲也 (神戸大)

【Session-7 スペシャルセッション(ポスター):共通コーパスを利用した耐雑音技術評価】15:45-16:30(概要説明) 16:30-18:00(ポスター展示)

(25) 自動車内における連続数字音声コーパス{CENSREC-2}の設計と評価
	藤本 雅清 (ATR), 武田 一哉 (名大), 中村 哲 (ATR)

(26) {AURORA2J/CENSREC3}による雑音抑圧手法の評価
	李 衛峰, チャンフィ ダット, 武田 一哉 (名大)

(27) 複数の雑音抑圧手法の統合に基づく雑音下音声認識
	濱口 早太, 北岡 教英, 中川 聖一 (豊橋技科大)

(28) Model-Based Wiener Filterによる雑音の種類に頑健な音声認識
	荒川 隆行, 辻川 剛範, 磯谷 亮輔 (NEC)

(29) A Pitch-Synchronous Peak-Amplitude based Feature Extraction Method with Noise Reduction, Modulation Enhancement, and Masking for Noise Robust {ASR}
	Muhammad Ghulam, Junsei Horikawa, Tsuneo Nitta (Toyohashi_Univ_Tech)

(30) 量子化{LSP}パラメータを用いた雑音下音声認識の{AURORA-2J}による検討
	森田 義則 (石川高専), 亀田 康介, 船田 哲男, 野村 英之 (金沢大)

(31) Evaluation of {Mel-LPC} based front-end for {CENSREC} database
	Babul Islam, Hiroshi Matsumoto, Kazumasa Yamamoto (Shinshu_Univ)

(32) 時間的差分学習に基づく環境適応による音声認識
	西田 昌史, 堀内 靖雄, 市川 熹 (千葉大)

(33) 音声特徴抽出法{SPADE}を用いたフロントエンドの耐雑音評価標準コーパスによる評価
	石塚 健太郎, 中谷 智広 (NTT)

【Session-8 ポスターセッション:一般】15:45-16:30(概要説明) 16:30-18:00(ポスター展示)

(34) 音声/非音声判別法を用いた時間圧縮音声再生法
	竹内 伸一, 杉山 雅英 (会津大)
 
(35) 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識
	尾上 和穂, 佐藤 庄衛, 小林 彰夫, 本間 真一, 今井 亨 (NHK技研)

(36) {Kernel PCA}を用いたロバスト特徴量抽出の検討
	滝口 哲也, 有木 康雄 (神戸大) 

(37) A Study on Endpoint Detection for Speech Recognition based on Discriminative Feature Extraction
	Koichi Yamamoto, Firas Jabloun, Klaus Reinhard, Akinori Kawamura (Toshiba)
 
(38) パワートラジェクトリー残響モデルに基づく残響の低減と音声認識による評価
	竹居 翼, 松本 弘, 山本 一公 (信州大)

(39) 発話位置依存{CMN}とマルチマイクロフォンアレイ処理の併用による遠隔発話の音声認識
	王 龍標, 北岡 教英, 中川 聖一 (豊橋技科大)

(40) 雑音環境下で視覚情報が日本語音節認識に及ぼす効果について
	星野 真人 (HRI-JP), 伊藤 仁 (東北大), 木村 真弘 (HRI-JP), 中村 真 (本田技研)

(41) 音声の構造的表象を用いた雑音環境下における日本語母音系列の自動認識
	村上 隆夫, 丸山 和孝, 朝川 智, 峯松 信明, 広瀬 啓吉 (東大)

(42) 音声の相対音感 --音声と音楽の同質性に関する一考察--
	峯松 信明, 西村 多寿子 (東大)

(43) {HMM}-based speaker adaptable polyglot synthesizer --Development and evaluation--
	Javier Latorre, Koji Iwano, Sadaoki Furui (Tokyo_Institute_of_Technology)

(44) 幼児エージェントによるバイアスの形成と言語獲得過程におけるその効果
	篠原 修二, 田口 亮, 桂田 浩一, 新田 恒雄 (豊技大)

(45) 音響尤度を用いた書き起こしデータ選択による音響モデル構築コストの削減
	加藤 智之, 戸田 智基, 猿渡 洋, 鹿野 清宏 (奈良先端大)

(46) タスク依存音響モデルのための発話レベルでの選択学習法
	ツィンツァレク トビアス, 戸田 智基, 猿渡 洋, 鹿野 清宏 (奈良先端大)

(47) {MSD-HMM}に基づく音声のスタイル識別
	川島 啓吾, 橘 誠, 山岸 順一, 小林 隆夫 (東工大)

(48) 係り受けとポーズ・フィラーの情報を用いた話し言葉の段階的チャンキング
	西光 雅弘, 高梨 克也, 河原 達也 (京大)

(49) 連続音声中の日本語特殊拍の{Web}型発音評価システム
	佐藤 暢也, 三輪 譲二 (岩手大)

シンポジウム実行委員 実行委員長: 田中和世(筑波大) 副委員長: 中村哲(ATR),出羽達也(東芝) 幹事: 大附克年(NTT),大淵康成(日立),伊藤敏彦(北海道大) 委員: 川端豪(関西学院大), 籠島岳彦(東芝), 大川茂樹(千葉工大), 持田岳美(NTT),    武田一哉(名古屋大), 山田武志(筑波大),    宇津呂武仁(京大), 中野幹生(HRI-JP), 福本淳一(立命館大), 神崎享子(NICT) 問合先:大附 克年(SP) NTTサイバースペース研究所 大淵 康成(SLP) 日立製作所基礎研究所 伊藤 敏彦(NLC) 北海道大学