Thesis Abstract: 089730534

氏名: 釜谷聡史 (089730534)

論文題目: 単語間類似度を用いた日本語ウイグル語対訳辞書における未登録語の補完

論文概要

我々は, 日本語-ウイグル語機械翻訳システムの研究を進めている. このシステムは, 日本語文に対する形態素解析結果を逐語訳することを基本としているが, 形態素解析に用いる辞書の単語数(約25万語)に比べ, 対訳辞書の単語数(約1.4万語)が少ないために, 形態素解析はできても, 翻訳ができない事例がしばしば見られる.

そこで, 本研究では, ウイグル語対訳を持たない日本語単語に対して, これに類似する対訳を持つ日本語単語を求め, 同じ対訳を与えることで, 対訳辞書の拡張を行う.

指標とする単語間の類似度は, 解析済み日本語コーパスから取り出した, 名詞と動詞の表層共起情報を用いて算出した. これに基づき, 名詞及び動詞各々について, 類似度上位100単語を人手によって評価した結果, 名詞60単語, 動詞59単語が訳語として許容できるものであった.

目次に戻る

提出時刻：2001/02/09 11:07:52

氏名: 釜谷 聡史 (089730534)

論文題目: 単語間類似度を用いた日本語ウイグル語対訳辞書における未登録語の補完

論文概要

氏名: 釜谷聡史 (089730534)