「ヒト」という謎だらけの知的システムの面白さ

「代謝物を全部測ること」に対する疑問の声にはどのように答えたのでしょうか。

 メタボローム解析は、差を見るのにとても良い手法です。例えばある疾病の患者30人の血液サンプルと、健常者30人の血液サンプルをメタボローム解析で、それぞれ数百種類の代謝物を全部測ります。その後コンピューターを使って統計処理すると、患者の血液だけに多く含まれている物質がすぐに分かります。つまり、患者と健常者の血液成分の違いから、その疾病のバイオマーカー(病気の変化や治療に対する反応に相関し、指標となる生体内物質)を見つけることができるすばらしい手法なのです。

「データドリブンになる」という確信は、どこから得られたものでしょうか。

 私は大学卒業後、情報科学、とりわけAI(人工知能)の分野で研究していました。AIの研究というのは、究極的には人の知能をコンピューター上に再現するのが目標ですが、これがとてつもなく難しい。自分が生きているうちにはできないと思ったのです。

 ある日ふと気がついたのが、自然界の驚くべきシステムです。自然界では、「ヒト」という知的システムが世界のいたるところで誕生しています。1個の細胞(受精卵)が分裂を繰り返し、最終的に37兆個の細胞からなる知的システムが半自動的に出来上がります。AI技術者が100年かかっても造れないような、画像処理や音声認識を行い、感情を持つといったものすごく知的なシステムが生まれ、言葉をしゃべり始めるのです。これはすごいことだと。その発生過程の仕組みがどうなっているのか、ほとんど分かっていないが、その設計図はゲノム(DNA)に書き込まれているということです。

 ヒトという生物の設計図であるヒトゲノムはA(アデニン)、T(チミン)、G(グアニン)、C(シトシン)という4つのアルファベットが30億文字並んだ長大な暗号文です。これは1Gバイトの情報量になります。最近のパソコンのデータ容量は700Gバイトぐらいありますから、それに比べたらほんのわずかです。わずか1Gバイトに人間1人の造り方が記載されているという事実は、私にとって衝撃でした。

 1990年ころ、この30億文字の解明を試みたのが、「ヒトゲノムプロジェクト」という国際コンソーシアムでした。当初は完了には25年かかる、つまり2015年までかかると言われていました(実際には2003年に完了)。当時私は「2015年ならまだ現役だな」と考えました。ヒトゲノムプロジェクトは字面を読むだけですが、その暗号文の意味を解析するとき、新たな生命科学が始まり、そのときには必ずコンピューターが主役になると考えたわけです。

 当時は30歳ちょっとでしたが、一から生物学を勉強し始めました。学生時代は生物が嫌いでした。暗記科目だったからです。教科書に答えが全部書いてあることを覚えるなんて面白くない。

 しかし30歳過ぎてあらためて学び始めるととても面白い。生物学や生命科学は謎だらけです。根本的なことが何も分かっていない。ある器官はどうなっているとか、個々の要素はよく調べられて分かっているけど、それらが集まるとどうやって驚くほど知的で頑丈なシステムができるのか、全体としてはほとんど分かっていないのです。

 教科書などでは40億年前に最初の生物が誕生し、それが突然変異と自然淘汰を繰り返すことで、こんな多様な生物種に進化した、という説明になっています。つまり誰かがデザインしたわけでもなく、偶然を積み重ねて37兆個の細胞から成るヒトという知的システムができたというわけです。

 しかしながら、生命が地球上で誕生したのかどうかすら、科学的証拠は見つかっていません。フランシス・クリックは最初の地球生命は宇宙から飛んできたと提唱しましたが、そうだとすると宇宙のどこで誕生したのか。宇宙は140億年前にビッグバンで始まったというが、その前はどうだったのか。疑問は尽きず、生命科学の奥の深さを感じました。

 さらに言うと、たとえば細胞分裂の際には、ゲノム(DNA)の情報をコピーしてから分裂します。でも、そもそもどうやって30億文字を間違いなくコピーできるのでしょうか。コピーを担当しているのはDNAポリメラーゼというたんぱく質で、その基本的な構造は20種類のアミノ酸が連なっただけのシンプルなものなのです。どうやってこんなに驚くほど精巧なナノマシンとして作動しているのか。

 他にもいろいろ未知のことが多いのですが、一方で、ヒトという高度な生命システムは現実に存在します。自分自身がその証です。謎だらけだけど確かに存在している。そのことがすばらしく面白いところです。