考察ルポ電王戦ー人間vsコンピュータの真実 - うぇるそふぃあ～35歳リーマンの生活収支改善ブログ～

ルポ電王戦―人間 vs. コンピュータの真実 (NHK出版新書 436)

作者: 松本博文
出版社/メーカー: NHK出版
発売日: 2014/06/06
メディア: 新書
この商品を含むブログ (7件) を見る

コンピュータと人間が本気で勝負をしたら、どちらが勝つのか？

2014年の現在無邪気に「人間だ」と答える人はもうほとんどいないのではないかと思う。

この本では、将棋という一つの競技の中での人間の挑戦の歴史が描かれている。

人間vsコンピュータと言ってはいるが、実際はコンピュータを進化させている者も人間であり、何人ものヒーローが時に劇的に、特に漸進的に技術を進歩させていくドラマが熱い。

この本の中ではいくつかのキーイベントが紹介されている。

まず、「機械学習」

人間が将棋を勉強しようと思ったら、とにかく将棋を指す。

過去の棋譜を見ながら「こういう時はこう打つんだ。」ということを勉強する。

何度も繰り返していく中で、なんとなく「いい形」というか、勝つために気を付けないといけないことが暗黙的に出来上がっていく。

昔のコンピュータのプログラムでは、例えば定石だったり、を人間が一つずつ教えこんでいた。また、何が「いい形」なのかを人間が明確に教え、コンピュータはその人間が決めた教科書的なプログラムを元に「計算」していた。

しかし、機械学習のすごいところは人間方式で、過去の棋譜を見たり、たくさんの打ち手の中から何が「いい形」でどう打てばいいのかを学習する。

この結果、ブレイクスルーが一気に進んだ。

そして、「ハードウェアの進歩、クラスタ化などの進歩」

これにより、コンピュータの演算能力が段違いで上がっていく。

どんなプログラミングでもポイントになってくるのが「無駄な計算をどうやって減らすのか」であり、将棋のように計算量がほぼ無限大になって来る場合「いつ無駄な選択肢をあきらめて、可能性のあるものを絞り込むのか？」が重要になる。

将棋の棋士はスマートに必要なものを見抜いていくので圧倒的な深読みができる。

それができないコンピュータは、「演算力にものを言わせてすべての選択肢をつぶす」という方法が、技術進歩と同時にとれるようになっていく。

ハードウェアの進歩、クラスタ化の進歩からこの電王戦では、ある試合では「東京大学の700台のコンピュータをつなげた」ハードウェアやら、もう聞いただけで震えてしまうような構造のコンピュータシステムが出てくる。

最後に、「複数システムの合議体」や「奇策封じ」の手法の進歩。

人間であれコンピュータであれ、「ミスをしないこと」というのは一つの圧倒的な強みである。将棋ソフトの中には、ミスを防ぐことやより優れた手を指すための「複数の将棋ソフトの合議体（＝あから2010）」やら、逆に「コンピュータソフトが苦手とする（＝ミスを誘発する）手を指す（＝やねうら王）」などの手法が現れ始める。

その結果、「ミスをしない」無機質なコンピュータという強みが目立ってくるようになった。

特に、この本の中では、いったんはソフトの悪手とも言えないような手（しいて言うなら、最善手ではないという意味で次善手）をとがめることで、優勢を築き上げた人間が、動揺などすることのないコンピュータに逆転される試合が何度も掲載されている。

また、他にも人間側が「ソフトの癖」をつくような形で勝ち切る棋士もおり、ある意味でコンピュータの「コンピュータらしい限界」が見えていたが、前述のやねうら王などの登場でコンピュータのある場面での極端な弱さというものも今後封じ込められていくのではないだろうか？

この本の凄味は、棋士側だけではなく、コンピュータソフトを開発している側も人間であり、どこまで行っても「人間vs人間」の勝負であるということを感じさせてくれることだと思った。

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

（読後感）

なんか、chikirinさんの記事

http://d.hatena.ne.jp/Chikirin/20130615

を1年前に読んでいて、内容が似てしまった・・・

同じ本を読んだのだから当然といえば、当然なのかなぁ・・・