近年、インターネットの普及に伴い、電子化されたテキストの数が著しく増加してい
る。それらの膨大なテキストの中から目的とする文書を検索するには多大な労力が必
要であり、効率の良い文章簡約手法が望まれている。そのような背景のもとで現在、
自動要約に関する研究が盛んに行われており、多くの自動要約手法の有効性が示され
ている。しかし、文章を対象とする研究では未だ完全な手法が示されておらず、従来
手法には幾つかの問題点がある。現在の自動要約手法においては重要文抽出に基づく
手法が主流になっている。この手法は文中の表層表現情報に基づいて文の重要度を決
定し、重要度の高い文を要約文として抽出するものである。これらの重要文抽出手法
は文単位の要約であるため、必要な情報が欠落しやすくなる。同様に重要文として抽
出された文にも冗長な部分が含まれていることが多い。また、重要文として抽出され
る文はテキスト中に散らばっているので、要約文に一貫性がなくなるという問題点も
ある。
これらを踏まえた上で我々は適切な重要部分から成り、一貫性のある文章簡約を目的
とする。文章構造を利用して文章の話題に沿った文を採用することで簡約の一貫性を
保証する。また、簡約に必要な情報を残しつつ簡約率を高めるために、各文をその構
成要素に分類、厳選し、それらから成る簡潔な体言止め表現へと変換する。さらに、
簡約結果に文章構造に基づくインデント付けなどを行うことで読み易さの向上を図
る。