強化学習 - Tic-Tac-Toe 三目並べ、マルバツゲーム、Tic-Tac-Toeというそうです。強化学習(Q-Learning)のまとめとしてチャレンジしてみました。Googleで「Tic-Tac-Toe」と検索すると三目並べで遊べます。 先に結果 ランダムな相手(後手)には80%近い確率…
普段やらない、強化学習について少し勉強したのでメモしておきます。 参考書籍 先に参考書籍の紹介です。 Pythonによる深層強化学習入門 ChainerとOpenAI Gymではじめる強化学習作者: 牧野浩二,西崎博光出版社/メーカー: オーム社発売日: 2018/08/17メディア…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。