氏名: 梅原 聰 (289634113)

論文題目: Classifier System を用いたゲームプレイルールの学習


論文概要

思考ゲームの指し手選択ルール(ゲームプレイルール)の学習に関する研 究がなされている。ここで、プログラムの指し手選択手法として、局面の 形勢を判断する評価関数をもとに行なうのが一般的である。しかし、複雑 な評価関数は微調整が困難であり、重要な要因であると考えられる対戦結 果をその学習に反映できない。 本論文では、if-then型ルールの学習システムである Classifier System を用いて、ゲームプレイルールを学習する手法を提案する。この手法は、 まず作成されたルールセットを用いて外部のプレイヤとの対戦を行ない、 その勝敗に基づきルールの有用度を判断する。さらに、遺伝的アルゴリズ ムによりルールセットを更新する。この二つの動作を繰り返し行なうこと で良いルールセットを生成する。 この学習法をtic-tac-toe ゲームを対象とした実験により、良好な結果 が得られた。特にパーフェクトプレイヤとの対戦による学習では、200回程 度の対戦により、同プレイヤに対し負けないルールセットが生成できた。 さらに、ルールの縮約を行なうことによりルールの数を減らし、また既 存の評価関数や定石を組み込むことにより学習の効率化をはかる。
目次に戻る