近年成功を収めつつある大語彙連続音声認識は、
新聞記事などの大量のコーパスから作成された統計的言語モデルが広く用いられて
いる。一方、実用的な音声対話システムを実現するためには、新聞記事などの
書き言葉ではなく、話し言葉の特徴を含む言語モデルの構築が不可欠である。
本研究では、音声認識における言語モデルを話し言葉に適したものへと改善す
るために、タスク適応、形態素解析辞書への話し言葉の登録、コーパスへのポー
ズ情報の挿入、音声認識実験評価時の曖昧な表記の統一を行なった。これによ
り、約9.3%の認識率の改善が得られた。さらに、言語モデルを対話の状況に
応じて変更する手法を提案する。本手法に基づき、対話システムの状況に対応
した言語モデルを複数作成しておき、システム応答を用いて適切に選択するこ
とで、約1.6%の認識率の改善が得られた。