氏名: ムフタル・マフスット(Muhtar Mahsut) (d05757)

論文題目: 膠着言語の特徴に基づいた日本語-ウイグル語機械翻訳に関する研究


論文概要

本論文では、日本語とウイグル語は構造が極めて近いという特徴を 利用した機械翻訳システムの実現における問題点とその解決の方法に ついて述べる。 機械翻訳を行なう際には、形態素解析、構文解析、意味解析、文生成などを 行なう必要がある。翻訳対象の自然言語文には、形態素、構文、そして意味上での 多くの曖昧さがあり、曖昧さの解消は、機械翻訳の過程で最も中心的な問題の 一つである。これらの問題を解決するためには、複雑な解析が必要であり、 正しくない翻訳結果が出力されてしまう原因のかなりの部分が、実に解析段階での 間違った解析結果によると言われる。 日本語とウイグルは、文法的構造、語の形態的構造及び助詞の対応など多くの面で よく似ており、同じくアルタイ語系に属すると言われている。このような特徴を 有効に利用することにより、複雑な解析をかなり回避することができ、品質の高い 翻訳結果がえられる。 日本語とウイグル語は共に膠着言語であり、膠着言語では名詞接尾辞(助詞を含む)、 動詞接尾辞(助動詞を含む)などの附属語がよく発達しており、語の構文上の役割を 決める。特に格助詞は、両言語において、文の表層構造及び深層構造に深く 係わっており、名詞接尾辞の中で重要な役目を負っている。日本語の格助詞と ウイグル語の格助詞の対応を明確に決めることができたら、両言語間の構造変換が ほぼ決まることになり、構文上の、または意味構造上の助詞による曖昧さが そのまま伝搬(あるいは継承)されることになる。すなわち、日本語文の構文上の 曖昧さが対応するウイグル語の文の同じ構文上の曖昧さになり、そのまま ウイグル語の文でも保持される。それらの曖昧さをあえて解析する必要がなくなる。 以上の観点から日本語とウイグル語の助詞について詳細な調査を行ない、両言語の 助詞がほとんど同じ性質を持ちかつ意味的対応が非常に安定していることを明らかに した。このことは、日本語の助詞を対応するウイグル語の助詞にほぼ直接に置き換え ればよいことを示しており、構文上のあるいは意味構造上の曖昧さの解析という 難しい問題を回避できることを意味している。 日本語-ウイグル語機械翻訳において、処理しなければならないもう一つの 問題として動詞接尾辞がある。動詞接尾辞は、動詞の語幹に付いて、その動詞に 新しい意味(例えば、使役、過去、受け身、否定、希望など)を付け加える機能を 持ち、両言語の動詞接尾辞のこれらの機能がよく対応している。しかしながら、 ウイグル語には、動詞の人称、動詞の複数を表すなど、日本語にない動詞接尾辞も あり、翻訳過程で、日本語のどの動詞接尾辞を、ウイグル語のどの接尾辞に置き 換えればよいかが中々決めにくく、より自然な翻訳結果を得ることは難しい。 本研究では、この問題を解決するための有効な手法を提案した。また、この 成果に基づいて、ウイグル語の動詞接尾辞の接続規則を確立した。 本研究で、解決する必要がある第三の問題として語の多義性の問題がある。 この問題は、日本語-ウイグル語機械翻訳に限らず、機械翻訳の一般的な課題 であるが、この問題に対しても両言語の特徴を活かすことにより、よい結果を 得ることができる。 本研究では、主に日本語-ウイグル語機械翻訳を研究対象にしているが、本研究で 得られた結果は、日本語と同じ構造を持つ他の言語間の機械翻訳にも応用できる と期待される。
目次に戻る