氏名: 堀之内 剛史 (m953428)
論文題目: 遺伝的プログラミングを用いたゲームの局面評価関数の学習
論文概要
思考ゲームのプログラムにおいて, 局面の形勢を判断する評価関数
の設計は重要な問題である. 本論文では, 思考ゲーム一般を対象と
して, 遺伝的プログラミング(GP)により評価関数を学習する手法を
提案する. GPは, 四則演算等の基本関数の集合とパラメータの集合
から構成される木構造を扱うので, 生成する評価関数の構造は柔軟
であるという特徴をもつ.
第一に, 相対的に優劣のついた対象ゲー
ムの局面の対を事例とし, その事例ベースを用いる教師あり学習に
ついて述べる. GPにより, すべての事例に対して, 先手プレイヤに
とってより有利な局面の方に高い値を返す評価関数を生成する. そ
の評価関数は, 事例ベースにない局面の対に対しても, 正しく形勢
を比較することが期待できる.
第二に, 教師あり学習を拡張して,
事例の知識を自動的に獲得する教師なし学習について述べる. この
学習法では, 形勢に関する知識は未知である局面の対を事例として
用いる. ここで, すべての事例において, 先手プレイヤにとってよ
り有利な局面がどちらであるのかを求めることで, 上記の教師あり
学習を適用できる. アプローチとして, GPによって生成した複数の
異なる評価関数間で, 対戦シミュレーションを繰り返す. 評価関数
の勝ち負けの結果は, 各事例の局面対の相対的な形勢判断のための
予想材料として用いる.
二つの学習法は, 簡単なゲーム二種を対象
とした実験により評価した.
目次に戻る