氏名: 田中慶 (m953422)

論文題目: 特徴量の類似性の抽出に遺伝的アルゴリズムを用いた手書き数字認識


論文概要

平成10年より郵便番号が7桁化されるにおいて、平成3,4年に郵政研究所が手 書き数字認識のコンテストを行ったことからも、手書き数字認識の重要性は増 すと考えられる。

手書き数字認識の概要は次のようである。特徴抽出は、入力された2値画像 を上下左右の外側から見た1番目と2番目の線を4方向で表現した傾きの数列(0〜 3)と、上左からみた線の数の数列をつなげて、1つの数列とした特徴値数列を 作ることによって行う。この特徴抽出法はほとんど整数の加減算のみで行うこ とができる。学習は、複数の学習用サンプルの特徴値数列を類似度に応じて数 グループに分類し、それぞれのグループを代表する特徴値数列を遺伝的アルゴ リズムによって生成することにより行う。認識は、入力された手書き数字の特 徴値数列と学習で生成された比較用特徴値数列とを比較することにより行う。

手書き数字認識に遺伝的アルゴリズムを適用する利点は、第1に、手書き数 字から特徴抽出した特徴値数列は、0〜3の整数の数列で表現され、この数列は 遺伝的アルゴリズムの遺伝子としてそのまま用いることが可能であるからであ る。第2に、遺伝的アルゴリズムは、多数の解候補の中から並列探索により最 適解もしくは準最適解を見つけることを得意とし、このことは同じ数字でも手 書きにより少しずつ異なる特徴量の中から最も代表的な特徴量の値を抽出する のに適しているからである。第3に、現在主に手書き数字認識にはオートマト ンやニューラルネットワークが用いられているが、オートマトンによる方法は 状態遷移の遷移先を決めておくために、前もって手書き数字のあらゆる形を想 定しておく必要がある。また、ニューラルネットワークによる方法は、学習結 果が重み値という形で表現されるため学習結果を理解するのが難しい。その点、 遺伝的アルゴリズムによる方法は、認識に必要な特徴は進化によって抽出され、 学習結果も傾きや線の数といった特徴量そのもので表現されるので学習結果を 理解しやすいからである。

学習と認識に電子技術総合研究所の文字データベースETL1を用いたときの、 この手法による手書き数字の認識率は98%であった。


目次に戻る