自己学習AI「将棋の新しい可能性示す」羽生竜王が評価:朝日新聞デジタル

ふむ・・・


2017年5月、英ディープマインド社が開発した「アルファ碁」が世界最強と言われる中国の柯潔(かけつ)九段に2連勝し、世界に衝撃を与えた。左は終局後、頭を抱えて盤面を見つめる柯九段。右は「アルファ碁」の打ち手役=中国・烏鎮
2017年5月、英ディープマインド社が開発した「アルファ碁」が世界最強と言われる中国の柯潔(かけつ)九段に2連勝し、世界に衝撃を与えた。左は終局後、頭を抱えて盤面を見つめる柯九段。右は「アルファ碁」の打ち手役=中国・烏鎮

ルールを教えた後は自己学習のみで強くなった囲碁、将棋、チェスの人工知能(AI)「AlphaZero(アルファゼロ)」が、人間による従来の型にはまらない斬新なプレースタイルを身につけていることが分かった。棋譜を見た将棋の羽生善治竜王(48)も「将棋の新しい可能性を示している」と評価した。開発した英ディープマインド社が7日、米科学誌サイエンスで詳細を公表した。

アルファゼロの最大の特徴は、三つのゲームとも同じプログラムで学習させたことだ。自己対局を繰り返すと、最初はランダムな指し手や打ち手を示すが、勝敗の結果から次第に学び、より有利な手を選ぶようになる。一定の強さに達するまでの学習に要する時間は、チェスは約9時間、将棋は約12時間、囲碁は13日間。それぞれ世界チャンピオンレベルの他のAIを倒すまで強くなったという。従来の人工知能は実戦の棋譜を学習に使っていた。

「アルファゼロ」について説明する英ディープマインド社のデミス・ハサビスCEO
「アルファゼロ」について説明する英ディープマインド社のデミス・ハサビスCEO

同社のデミス・ハサビスCEO(最高経営責任者)は「他のゲームにも応用できるし、今後、実世界でも様々な課題が克服できるような展開が可能ではないかと思っている」と話した。

人間の経験則に基づかないアルファゼロは、人間では考えつかないような手を選択する。例えば将棋では、守りの要の自陣の金を積極的に前線に繰り出したり、価値が高いとされる「と金」を簡単に捨てたりするという。

棋譜を見た羽生竜王は「アルファゼロは先手の対局では序盤で速攻を目指しますが、後手の場合はじっくりと守りを固める柔軟性に富んだプレーヤー。王将を中段に動かすことをいとわないのは今までの将棋理論にはなく、人間から見るとリスキーな選択をしているように見えます。しかし信じられないことに局面の主導権をいつも握っています。そのユニークな対局スタイルは、将棋の新しい可能性を示しています」とコメントした。(村上耕司)

情報源:自己学習AI「将棋の新しい可能性示す」羽生竜王が評価:朝日新聞デジタル




ほぉ・・・