氏名: 加藤 芳秀 (489934013)

論文題目: 実時間音声言語処理システムのための漸進的構文解析手法に関する研究


論文概要

漸進的構文解析は,談話文など,自然言語文をその単語 の出現順序に従って解析し,入力途中の段階でその解析 結果を生成する.同時的な意味解析や,同時通訳に代表 される実時間音声言語処理システムの実現に必要な要素 技術の一つである.

漸進的な構文解析を実現する手法として,これまでに漸 進的チャート解析が提案されている.これは,上昇型構 文解析手法の一つであり,単語が入力される毎にそれま での入力に対する部分構文木(構文木の部分木になる可 能性のある木)を生成できる.

漸進的構文解析が実時間音声言語処理システムの一つの モジュールとして組み込まれるとき,解析結果が正確で あるのはもちろんのこと,さらに,早い段階で解析結果 を出力することが求められる.ところが,漸進的チャー ト解析はこれらを十分に満たしてるとはいい難い.

本研究は上記の要件をみたすような漸進的構文解析の実 現を目標とし,そのための第一歩として,具体的には次 の項目について検討する.

  1. 漸進的構文解析における出力タイミングの制御
  2. 漸進的な依存構造解析

項目1.は,解析の正確さの向上を目指したものであ る.漸進的チャート解析は,文の断片的な情報のみを用 いて部分構文木を生成するため,文全体に対する構文木 の部分を構成しない誤った木を生成する可能性がある. 構文解析に続くモジュールに正しい解析結果を出力する ためには,部分構文木の出力を遅らせて,後続の情報を 待ち,その情報を用いて誤った木を削除することは一つ の方法である.しかし,出力の同時性の度合と解析の正 確さの度合はトレードオフの関係にあり,それらに関す る知見もほとんど得られていない現状において,出力タ イミングを決めることは難しい.そこで,本研究では, 出力タイミングに関する知見を得ることに主眼を置き, 以下の手法を提案する.

まず,漸進的チャート解析において正しい部分構文木が 確定した段階で,それを出力する手法を提案する.本手 法では,漸進的チャート解析に正しい部分構文木のみを 出力するための仕組みを導入する.漸進的チャート解析 により生成されたすべての構文木についてそれが正しい かどうかを判定する.文法上の制約をもとに,その時点 以降に入力可能な単語列を考慮し,それに続いてどのよ うな単語列が入力されても誤りとならないことが確定し た構文木のみを出力する.このため,場合によっては, 文末まで解析結果を全く出力できないこともあるが,一 方で,誤った解析結果を出力しないといった特徴がある. 本手法をATISコーパスに適用した結果,正確さを優先し たときの出力の遅延は,文が長くなるにつれて大きくな る傾向がわかった.最大遅延は文の長さの約6割,平均遅 延は文の長さの約3割であった.

次に,誤りをある程度許容した場合の出力タイミングを 検討するため,上記の手法を拡張し,生成された各部分 構文木に対して,それが正しい構文木になるような単語 列がそれ以降に入力される確率を確率文脈自由文法に基 づいて計算する手法を提案する.正しい単語列が入力さ れる確率が高い構文木を出力するため,誤った構文木を 出力する可能性はあるものの,ある程度の解析の正確さ を保ちつつ,上記の手法より早い段階での構文木の出力 が可能である.本手法をATISコーパスに適用した結果, 正確さを優先したときと同様に,出力の遅延は,文が長 くなるにつれて大きくなる傾向がわかった.正解率98.3 \%のとき,最大遅延は文の長さの約4割,平均遅延は約2 割であった.

項目2.は,解析結果を早期に出力することを目指し たものである.そもそも,解析結果を早い段階で出力す るためには,解析結果を短時間で生成する必要があるが, 文の断片に対する可能な部分構文木の数が膨大になる場 合,それを実現するのは難しい.一方で,場合によって はこの問題を回避できる可能性がある.すなわち,解析 結果として,構文木よりも単純な構造,例えば,単語間 の修飾・被修飾の関係である依存関係(日本語における 係り受け関係)を明らかにすればよいような場合である.

文脈自由文法に依存関係情報を付与することにより,構 文木から依存関係を計算できることは広く知られている が,本研究では,まず,漸進的チャート解析と構文木か らの依存構造計算を組み合わせることにより,漸進的な 依存構造解析が実現できることを示す.次に,これと同 等かつ,より効率的な依存構造解析を実現する手法とし て,到達可能性に基づく漸進的依存構造解析手法を提案 する.本手法は,漸進的チャート解析のよ うに入力された文の断片に対する構文木を生成する必要 がなく,効率的な解析が可能である.提案手法の正当性 を理論的に示すと共に,ATISコーパスを用いた解析処理 実験を行い,提案手法が解析処理時間の短縮に有効であ ることを確認した.漸進的チャート解析に基づく手法に 比べると,平均して約1000分の1程度の依存構造解析処理 時間の短縮を示した.

これらの研究成果は, 実時間音声言語処理システムの開発において, 有用な基礎的技術となることが期待できる.


目次に戻る


提出時刻:2002/02/08 13:30:08