氏名: 祖父江 恒夫 (289634245)

論文題目: 複合文書のレイアウト解析に関する研究


論文概要

文書画像理解に関する研究は、文書情報の電子化、情報抽出時の手作業の軽減 を目的としており、今日までに種々の文書に対して行われており、その多くが 文書モデル(文書に関する知識)に基づいて文書画像を解釈する枠組みになって いる。また、複合的な文書を対象とした文書画像理解の研究も行われているが、 その目的はまだ十分には達成されていない。 文書モデルに基づいて文書画像を解釈する場合、文書モデルの表現が重要な問 題となってくる。単一文書には、その文書特有のレイアウト構造などがあり、 これらの特徴を利用することができるが、複合的な文書には文書特有の情報が 少なく、文書全体に共通した特徴に基づいて文書モデルを表現しなければなら ない。 本研究では文書モデルに基づいたレイアウト解析を目的とする。文書モデルを 項目域の隣接・接続関係、項目域間の分割セパレータ、そして項目特有の情報 などの多くの複合的な文書に見られる特徴に基づいて表現し、この文書モデル に基づいてレイアウト解析処理をする。また、実験の結果からこの表現方法の 有効性を明らかにする。
目次に戻る