氏名: 長森 誠 (289934206)

論文題目: 複数の音声対話システムの統合制御機構に関する研究


論文概要

音声インタフェースの普及により様々な音声対話システムが我々の生活に浸透しつつある. 例えば,自動車内においては,カーナビ,エアコン,カーオーディオなどが音声で操作可能である. このような場合,各機器が音声入力を独立に実現していると,ユーザ発話がどの機器への入力であるか判断することは困難である. 例えば,「消して」という発話はすべての機器に対して有効であるため,意図しない機器まで動作してしまうことになる. 一方,すべての機器を1つのシステムとしてコントロールする場合は,先述の問題は解消できるが,実現が煩雑になるとともに, 拡張性が乏しくなる.

本研究では,複数の音声対話システムを統一的なデータ構造に基づく通信により結合し, 統合的に制御するシステム(マルチドメイン音声対話システム)のアーキテクチャを提案する. 本アーキテクチャは,ワークモジュールと呼ばれる,音声対話システムに相当する単一ドメインの処理を行なうモジュールと, マネージャと呼ばれる,ワークモジュールを統合的に制御する機構から構成される. またシステム内ではフラグメントと呼ばれる,音声入出力や付加情報を表現したデータを各モジュール間で分配・統合する. すべてのモジュールがフラグメントを送受信できるように設計することにより, それらを結合するだけでマルチドメイン音声対話システムが構成できる.この手法により,機能の追加・変更がドメイン毎に行え, 拡張性が高く柔軟なシステムの実現が可能になる. また,ユーザ発話を適切なワークモジュールに振り分ける手法として, ユーザ発話中の語彙とワークモジュールの持つ語彙のマッチング及び発話履歴から関連度を計算しワークモジュールを選択する方法を 実現し評価した.さらに,既存の音声対話システムをワークモジュールに変更する実験を行い 移行コスト評価した.本アーキテクチャに基づく簡単なマルチドメイン音声対話システムに対し, 操作性に関する評価実験を行ったところ,発話の93.6%において正しいドメインを選択できることが確認され, 好意的な評価を得た.


目次に戻る


提出時刻:2001/02/09 16:08:04