将棋AIで学ぶディープラーニング

AlphaGoのディープラーニングの仕組みを詳しく説明してくれていてありがたい。

将棋AIで学ぶディープラーニング

将棋AIで学ぶディープラーニング

将棋とかだと評価関数のパラメータ学習させるNNなんかを想像するけどCNNでやるんだね。
盤面や持ち駒の表現の仕方はこんな風にするんだと驚きました。勉強になります。
スパースなデータ表現をしてそれをCNNで特徴検出するのは案外よくやる手何ですかね。
強化学習のさせかたなんかも参考になる。