氏名: 長江 信隆 (289634326)

論文題目: ゲームの局面評価関数の学習への遺伝的プログラミングの適用


論文概要

 思考ゲームのプログラミングにおいては、局面の形勢判断を行なう静的評価関数を適切に定めることが重要である。これを学習により自動的に獲得する研究としては、Samuel(1959)の係数の重み学習、Tesauro(1992)の強化学習などが知られているが、これらはいずれも対象ゲームの性質やエキスパートの知識を使うことにより、強い評価関数を獲得している。相対的な優劣のついた局面対(事例)から遺伝的プログラミング(GP)によって学習を行なう堀之内(1996)らの研究においてもエキスパートの知識が用いられている。
 本研究の目的は、このようなエキスパートの知識を用いずに純粋に盤面の状態、つまりゲームのルールに関する知識のみを用いて学習を行い、適切な評価関数を生成することにある。
 そこで、局面の絶対評価が得られるtic-tac-toeを対象とした。盤面の位置情報のみからなる局面の対から事例を構成し、満たした事例の数を適応度としてGPにより学習を行なった。また、評価関数の良い部分構造を保存する自動関数定義(ADF)を用いた場合についても実験を行なった。いずれの場合も負けにくい評価関数を獲得することができたが、エキスパートの知識を用いた場合に比べ一桁以上多い計算時間を要した。

目次に戻る