将棋AIで学ぶディープラーニング
AlphaGoのディープラーニングの仕組みを詳しく説明してくれていてありがたい。
- 作者: 山岡忠夫
- 出版社/メーカー: マイナビ出版
- 発売日: 2018/03/14
- メディア: Kindle版
- この商品を含むブログ (1件) を見る
将棋とかだと評価関数のパラメータ学習させるNNなんかを想像するけどCNNでやるんだね。
盤面や持ち駒の表現の仕方はこんな風にするんだと驚きました。勉強になります。
スパースなデータ表現をしてそれをCNNで特徴検出するのは案外よくやる手何ですかね。
強化学習のさせかたなんかも参考になる。