Murayama blog.

プログラミング教育なブログ

2019-09-01から1ヶ月間の記事一覧

強化学習 - Tic-Tac-Toe

強化学習 - Tic-Tac-Toe 三目並べ、マルバツゲーム、Tic-Tac-Toeというそうです。強化学習(Q-Learning)のまとめとしてチャレンジしてみました。Googleで「Tic-Tac-Toe」と検索すると三目並べで遊べます。 先に結果 ランダムな相手(後手)には80%近い確率…

強化学習の始め方

普段やらない、強化学習について少し勉強したのでメモしておきます。 参考書籍 先に参考書籍の紹介です。 Pythonによる深層強化学習入門 ChainerとOpenAI Gymではじめる強化学習作者: 牧野浩二,西崎博光出版社/メーカー: オーム社発売日: 2018/08/17メディア…