たった３日でアルファ碁に100戦全勝「アルファ碁ゼロ」、講談社：機械学習スタートアップシリーズ、速習強化学習―基礎理論とアルゴリズム、強化学習と深層学習 C言語によるシミュレーション、Chainer v2による実践深層学習、やさしく学ぶ機械学習を理解するための数学のきほん、初めてのTensorFlow 数式なしのディープラーニング: ホットコーナー

ASAHIネット([URL] )のjouwa/salonから。
---
　機械学習、深層学習(ディープラーニング)、強化学習関係の新刊がずいぶん出ていますね。

　その前に。

■たった３日でアルファ碁に100戦全勝「アルファ碁ゼロ」
　人間の囲碁のトッププロを、撃破島倉千代子な「アルファ碁」。
[URL]
アルファ碁はなぜ人間に勝てたのか。人工知能は碁盤の夢を見るか? アルファ碁VS李世ドル。趙治勲九段、コンピュータに勝つ。進化計算と深層学習創発する知能
で書いたが、また書く。
　ルールだけ教えて、あとは、高得点を取れという目標だけ与えると、強くなるアルゴリズムであるDQNは、次で初めて知った。
　アルファ碁でも使われたという。
--- ここから ---
　それは、DQNという手法。これで、昔のテレビゲームを、ろくにルールも教えず、単に高得点を取れと命令して、コンピュータにやらせると、画像認識で何万回も試行錯誤しながら、あっという間に人間の達人より、そのゲームがうまくなる話が出てくる。
--- ここまで ---

[URL]
進化計算と深層学習 -創発する知能― 単行本（ソフトカバー）2015/10/21
伊庭斉志 (著)

　そんなアルファ碁を、完全に圧倒するAI囲碁ができた。しかも、他の対局データ、教師データなしで、自分で対局して強くなったという。
　その名は、「アルファ碁ゼロ」。
　囲碁のルールだけで、あとは勝てと目標を与えたら、めっちゃ強くなったというから、DQNをさらに洗練させたんでしょうか。とにかく強化学習だけでやったそうです。
　それで、３日間、約490万回の自己対局をしたら、アルファ碁に100戦全勝。軽くアルファ語より強くなった。
　すごすぎるわ。
　アルファ碁が、人間のトッププロの対局データを使って学習したときよりも、効率よく、しかも圧倒的に強くなったということは、人間が打った手は、実は勝つためにはよくない手、よくない定石が多かったということを意味するのだろうか。

[URL]
アルファ碁が進化した最新囲碁ソフトが誕生対局データなしに独学で最強に
掲載日：2017年10月20日

[URL]
アルファ碁の最新作「ゼロ」　訓練わずか３日で先代に１００戦全勝　自己対局ひたすら繰り返す
2017.10.19 15:10

関連：
[URL]
NHK Eテレ「人間ってナンだ?超AI入門」、養老孟司の唯脳論、身体性、知能ロボット、PEZY Computing、ディープラーニング、AIプロセッサ、その他もろもろ
[URL]
「詳解ディープラーニング TensorFlow・Kerasによる時系列データ処理」「TensorFlowはじめました１、２」「Interface(インターフェース) 2017年08月号「算数&ラズパイから始める人気AI ディープ・ラーニング」」のことも
[URL]
雑誌インターフェイス2017年8月号は、ディープ・ラーニング特集しかもラズパイで！ほかの号は、IoTやウルトラ大集合やらいろいろ
[URL]
日本AIベンチャーの雄、Preferred Networks(PFN)が、総務省の開発指針に反対する理由でわかる官僚お得意のガイドライン行政の罠 [URL]
続：日本AIベンチャーの雄、Preferred Networks(PFN)が、総務省の開発指針に反対する理由でわかる官僚お得意のガイドライン行政の罠。電子書籍の出来は？
[URL]
AI(人工知能)、機械学習、深層学習、ディープラーニングの本が百花繚乱
[URL]