薬剤の開発でも人工知能(AI)の応用が加速している。Google傘下のディープマインドが「AlphaFold(アルファフォルド)」と呼ばれるAIソフトウエアを昨年発表した。数多の研究者が100年をかけて進めてきた研究の成果に近いものを、計算により一瞬ではじき出す力を持ち得る技術だ。AIは抗がん剤をはじめ新薬創出の在り方をどこまで変えるのか。AIと創薬の最前線を訪れた。

 ディープマインド(DeepMind)。囲碁の対局でプロを打ち負かし、世界をあっと言わせた「AlphaGo(アルファ碁)」を開発した企業と言えば、聞き覚えがある人も多いかもしれない。

 このディープマインドが、次に照準を合わせたのは「タンパク質」だ。タンパク質の形を、AIを用いた計算によりコンピューター上で再現することに成功した。それが「AlphaFold」である。

 このタンパク質について同社はこう表現する。「そもそもタンパク質は、命を維持するために欠かせないもの。筋肉を動かしたり、光を感じ取ったり、食べ物をエネルギーに変えたりする。体の働きはその根っこをたどるとタンパク質の働きに通じる。このタンパク質は遺伝子の情報に基づいて作られている」

100年かかった研究成果が…

 タンパク質の形を知ることは、医学の発展にとっては重要な要素の一つとなる。タンパク質が体の中でどう働くかは、その立体的な形次第という側面があるからだ。普段タンパク質について考えることがない人も多いかもしれないが、タンパク質が体の中で働くためには意外とその形が大きな意義を持つのだ。例えば、感染症に対抗する「抗体」と呼ばれるタンパク質はアルファベットの「Y」の形、最近注目されるゲノム編集に働く「クリスパー・キャス9」ははさみの形をしている。こうした形がその機能とも深く関わる。

 実際、現代に至るまで、タンパク質の形を知ろうとする試みは連綿と続いてきた。1895年のX線の発見に始まり、その後、結晶解析などの手法が開発され、形の解明は進歩してきた。巨大な放射線設備で、緻密なタンパク質の形が分かり始めたのは、この30年ほどのことだ。

 ディープマインドは、これまでとは全く異なる発想から、このタンパク質の立体的な形を理解しようとしてきた。ディープラーニングの技術を使ってである。既に形が判明しているタンパク質のアミノ酸のつながり方を大量に学習させる。タンパク質とは、20種類のアミノ酸が様々な順番でつながってできている。このタンパク質において、アミノ酸同士がつながったときに、どのように引き合うか、どういった角度で曲がるかを予測。そうして、新たなタンパク質でもその形を予測できるようにしたのである。

図1●ディープマインドが示すタンパク質の構造を予測する流れ図(出典:ディープマインド、図2も)
一番上にある「タンパク質シーケンス(Protein Sequence)」は、タンパク質を示している。S、Q、E、Tなどは一つ一つが異なるアミノ酸を示している。これが連なったのがタンパク質。この配列に基づいて、「ニューラルネットワーク(Neural Network)」によりタンパク質の形を予想する。多数のタンパク質の情報を含む「データベース(Databases)」に基づいて、アミノ酸同士の距離の予測(Distance Predictions)とタンパク質が曲がる角度の予測(Angle Predictions)を行う。ここから構造が決定される。

 100年近く、巨大な装置を駆使しても完全には解明できなかった難業を、過去のデータとAIで解く。タンパク質の折れ曲がり方(Fold)を解明するAI。それがAlphaFoldとなる。

図2●AIで予測したタンパク質の構造(緑)と実際のタンパク質の構造(青)