氏名: 梅原 聰 (289634113)
論文題目: Classifier System を用いたゲームプレイルールの学習
論文概要
思考ゲームの指し手選択ルール(ゲームプレイルール)の学習に関する研
究がなされている。ここで、プログラムの指し手選択手法として、局面の
形勢を判断する評価関数をもとに行なうのが一般的である。しかし、複雑
な評価関数は微調整が困難であり、重要な要因であると考えられる対戦結
果をその学習に反映できない。
本論文では、if-then型ルールの学習システムである Classifier System
を用いて、ゲームプレイルールを学習する手法を提案する。この手法は、
まず作成されたルールセットを用いて外部のプレイヤとの対戦を行ない、
その勝敗に基づきルールの有用度を判断する。さらに、遺伝的アルゴリズ
ムによりルールセットを更新する。この二つの動作を繰り返し行なうこと
で良いルールセットを生成する。
この学習法をtic-tac-toe ゲームを対象とした実験により、良好な結果
が得られた。特にパーフェクトプレイヤとの対戦による学習では、200回程
度の対戦により、同プレイヤに対し負けないルールセットが生成できた。
さらに、ルールの縮約を行なうことによりルールの数を減らし、また既
存の評価関数や定石を組み込むことにより学習の効率化をはかる。
目次に戻る