「~AIが命を救い、新薬を開発する!~ 人工知能が切り開く未来医療」。こう題した市民公開講座に、第15代 人工知能学会長も務めた公立はこだて未来大学 システム情報科学部 教授の松原仁氏が登壇した。同氏は、「囲碁・将棋の例から人工知能の将来を考える」を演題に講演。知的ゲームの象徴として囲碁・将棋を例にAI研究者が競ってきたことを振り返り、将来、人間とAIがどう付き合っていくべきかを考察した。

自己対局によって学習を重ね、名人より強くなった

 囲碁や将棋はルールが明確で、勝ち負けという評価基準があることから、AI研究の良い例題として語られてきた。松原氏はまず、1950年代にAIがチェスを例題に研究が始まり、1997年に「ディープ・ブルー」と呼ばれるIBM製スーパーコンピューターが、チェス世界チャンピオンのガルリ・カスパロフに勝ち越したことを紹介。

講演する松原氏(写真:森田 直希)

 コンピューター将棋では、2006年に機械学習を用いた「Bonanza」(ボナンザ)というソフトが登場し、コンピューター将棋選手権で優勝。2010年には松原氏が研究開発責任者だった「あから2010」が、当時の女流王位・女流王将2冠の清水市代氏に勝利。そして囲碁の世界では、Google DeepMindによって開発された「AlphaGo」(アルファ碁)が2015年にプロ囲碁棋士を初めて破って大きな話題になったことを振り返った。

 そのAlphaGoの登場からわずか1年後、世界最強と言われる中国、台湾のプロ棋士に勝利した「AlphaGo Zero」が登場した。それが、AIの学習法を一気に進化させたと松原氏は指摘する。「AlphaGoは、プロ棋士の棋譜3000万局面を集めてAIに学習させることで、プロ棋士より強くなった。これに対してAlphaGo Zeroはプロの棋譜を一切使わず、自己対局によって学習を重ね、名人より強くなった」(同氏)。このAlphaGo Zeroで用いられた機械学習が、強化学習と呼ばれる最新の学習手法である。