AlphaGoのソフトウエアには、囲碁のルールすら組み込まれていない。
過去の棋譜をニューラルネットに入力する「教師あり学習」と、勝利を報酬に囲碁AI同士を対局させて鍛える「強化学習(教師なし学習)」だけで、世界最強と称されるプロ棋士を破るまでに成長させた。
......................... 少なくとも、未知の定石や打ち筋といったイノベーションを生むスピードで言えば、コンピューターは囲碁の領域で「シンギュラリティ(技術的特異点)」に達した、と言わざるを得ない。
( 今後は、コンピューターとプロ棋士の組み合わせが生み出すイノベーションへと焦点が移るだろう。 ? ? ? )
プレーヤーが全情報を把握できる「完全情報ゲーム」でなくとも、ディープラーニングは適切な「入力データ」と「教師データ」「報酬データ」を用意できれば威力を発揮できる。
これまで人間が担っていた「認識」「検知」に関わる領域、例えば画像認識、音声認識、顔認証から、防犯カメラに映った人間の振るまい解析、サイバー攻撃の予兆検知、医療用画像の解析などで、人間を超える精度を実現しつつある。
◇ディープラーニングの「弱み」とは
今回の五番勝負は、ディープラーニングの強みに加えて、ディープラーニングを実社会に応用する上での二つの弱点を露呈させた。
一つは、AIが明らかに誤りと思える判断を出力した場合にも、その原因の解析が極めて困難であることだ。
イ・セドル氏が勝利した第四局では、AlphaGoは明らかな悪手を繰り返した後に敗北したが、その原因は当のDeepMindのメンバーにも分からなかった。
通常のプログラムであればコードを追跡してデバッグできるが、ディープラーニングには人間が読める論理コードはなく、あるのは各ニューラルネットの接続の強さを表すパラメーターだけ。
アルゴリズムは人間にとってブラックボックスになっている。
もう一つは、高度に訓練されたAIは、例え結果的に正しい判断であっても、人間にはまったく理解できない行動を取る場合があることだ。
特にAlphaGoが勝利した第二局では、プロ棋士の解説者は「なぜAlphaGoの奇妙な打ち手が勝利につながったのか、理解できない」といった言葉を繰り返した。
この点は、AIと人間が共存する環境、あるいはAIの判断が人間の生死に関わるような用途では、大きな問題となる。
例えば、自動運転車のAIが、周囲の人間には理解しがたい運転を繰り返すようでは、人間の運転ミスを誘発しかねない。
日本経済新聞 2016/3/17 6:30
http://www.nikkei.com/article/DGXMZO98496540W6A310C1000000/