氏名: 堀之内 剛史 (m953428)

論文題目: 遺伝的プログラミングを用いたゲームの局面評価関数の学習


論文概要

思考ゲームのプログラムにおいて, 局面の形勢を判断する評価関数 の設計は重要な問題である. 本論文では, 思考ゲーム一般を対象と して, 遺伝的プログラミング(GP)により評価関数を学習する手法を 提案する. GPは, 四則演算等の基本関数の集合とパラメータの集合 から構成される木構造を扱うので, 生成する評価関数の構造は柔軟 であるという特徴をもつ.
第一に, 相対的に優劣のついた対象ゲー ムの局面の対を事例とし, その事例ベースを用いる教師あり学習に ついて述べる. GPにより, すべての事例に対して, 先手プレイヤに とってより有利な局面の方に高い値を返す評価関数を生成する. そ の評価関数は, 事例ベースにない局面の対に対しても, 正しく形勢 を比較することが期待できる.
第二に, 教師あり学習を拡張して, 事例の知識を自動的に獲得する教師なし学習について述べる. この 学習法では, 形勢に関する知識は未知である局面の対を事例として 用いる. ここで, すべての事例において, 先手プレイヤにとってよ り有利な局面がどちらであるのかを求めることで, 上記の教師あり 学習を適用できる. アプローチとして, GPによって生成した複数の 異なる評価関数間で, 対戦シミュレーションを繰り返す. 評価関数 の勝ち負けの結果は, 各事例の局面対の相対的な形勢判断のための 予想材料として用いる.
二つの学習法は, 簡単なゲーム二種を対象 とした実験により評価した.
目次に戻る