シーケンサーとは、生物の設計図となるDNA(デオキシリボ核酸)配列を読み出すことができる解析装置のこと。1970年代、後にノーベル化学賞を2回受賞するフレデリック・サンガー氏により発明されたが、2000年代に解析の仕組みが改善されたことで高速化。それ以降のシーケンサーが次世代シーケンサー(next generation sequencer:NGS)と呼ばれるようになった。

解析装置とデータ処理で進化

 シーケンサーが読み取る対象となるDNAは、「A(アデニン)」「T(チミン)」「G(グアニン)」「C(シトシン)」という4種類の「塩基」と呼ばれる物質がおよそ30億個連なった巨大な分子。その直径は2.5ナノメートル(ナノは10億分の1)。この細い鎖のようなDNAの「ATGC」の並び順がシーケンサーによって読まれる。

 基本的な原理は、DNAが「AとT」「CとG」とで対になる性質を生かすというもの。ATGCがつながったDNAと対になるようにATGCを1対1で対応させていき鎖を伸ばす。要するにDNAをコピーしていく「伸長反応」を起こす。これでATGCがどのような順番でついていくかを検出して、DNAの並び順を確認する(関連記事:医学の源泉は試験管からデジタルへ)

 次世代シーケンサーが登場するまでは、様々な長さでこのコピーを途中で停止させ、それぞれの長さになったDNA断片をゲルの中に流すという方法が用いられていた。DNA鎖が長いほどゲルの中を移動する距離は短くなり、その違いによってDNAの断片を分けて、配列を調べるのである。 検出には当初、放射性物質を使っていたが、その後に蛍光色素を使うようになった。

 それが2000年代に、解析対象としているDNAをコピーさせる原理は同じだが、多数のコピーを同時に複製させ、そのときの反応で発生する蛍光をレーザーで読み取る方法などが登場。ブレークスルーになった。

 こうしたシーケンサーの進化とともに、データ処理も大きな変化が起きている。もともとは、DNA鎖の配列を順に呼んでいたが、ばらばらに読まれた配列を後でつなぎ合わせるように。例えていえば、最初は、一人の人が文書を最初から読む方法だった。それが、最近では、大勢の人が、シュレッダーでばらばらになった文書を分けて読み、コンピューターに入力した上で、後からつなぎ合わせる方法になったのだ。

 解析装置とデータ処理技術を組み合わせることで、DNA解析の大幅な高速化が実現し、その後ゲノムの応用は新しい時代に入っていく(関連記事:背水の陣で臨んだ、がんゲノム解析事業)