氏名: 小川 泰弘 (m953410)

論文題目: 派生文法による日本語形態素解析


論文概要

これまでの日本語形態素解析は用言の活用を前提として行われてきた。
そのため動詞の活用をどのように処理するかが大きな課題であった。
しかし清瀬(1989)は日本語の膠着言語としての性質に着目し、動詞の語幹
に修辞機能をもつ接尾辞が次々と接続することによって、その意味を変化
させるという派生文法を提案した。これにより活用という考えを用いずに、
簡明な規則で動詞の語形変化を記述することが可能となった。
また音便形に対しては、派生文法においても単純な接続規則だけでは表現
できず、多くの異形態の辞書登録が必要という問題があった。
本研究では入力文の後方からの探索、および子音の補完という手段により、
この問題を解決した。

本研究では以上の特徴をもつ形態素解析法を提案し、従来の手法と比べて
以下の特長があることを示す。

  1. 動詞の語形変化に対する処理が単純である
  2. 品詞の種類が少数であり、形態素文法が単純である
  3. 辞書登録する単語が比較的少数ですむ
  4. 口語的表現への対処が容易である
また本手法に基づいた形態素解析システムを計算機上に実装し、EDR日本語
コーパスを解析させて、その性能の評価を行った。コーパス200文に対する
実験では形態素数4793個に対して98.5%の割合で正しい品詞を付与できた。
現在、入力文を増やして実験を継続中である。

目次に戻る