前回はユーザエクスペリエンス(UX)の視点から、そもそもクラウドとは何か、医療分野での活用のメリットは何かについて解説した。今回は、実際にクラウドが、がんのゲノム医療実現にどのように関わっているか見ていこう。

 がんのゲノム医療とは、個々の患者のがん細胞の全ゲノムデータを読んで、ゲノム中の変化(バリアント)を知り、それに最も適した薬を選んで治療する医療のこと。そして、約30億個といわれる塩基配列を含む膨大なデータの解析を行うのが、シークエンサー(遺伝子を読む装置)である。

 このシークエンサーでシェアナンバーワンの企業が、米国のイルミナ社だ。このイルミナ社の解析スペースサービスBaseSpace Sequence Hub1)は、クラウドであるAmazon Web Service(AWS)上で行われている。ゲノムの場合、データ量が数GBから数十GBになることが多いため、クラウドにデータを置いて解析をすることが望ましく、クラウドを用いた事例が海外では多く報告されている。例えば、Microsoft Genomics 2)、 Google Cloudを利用したゲノム解析3)、 AWSを利用したがんゲノムのクラウドThe Cancer Genomics Cloud (CGC)4)など。シークエンサーから直接クラウドに接続しているケースも少なくない。

1)BaseSpace Sequence Hub(Illumina)
2)Microsoft Genomics(Microsoft Azure)
3)Cloud Life Sciences(Google Cloud)
4)Cancer Genomics Cloud (CGC)

 解析・保存すべきゲノムのデータ量が巨大になっていくことについては、2015年の記事であるが、『Nature』という有名な論文誌のNews欄にて 5)、2025年までには100万人から2億人のヒトゲノムが読まれて、2〜40エクサバイトのストレージが必要になるだろうと予測されている。ギガバイトの1000倍がテラバイト、その1000倍がペタバイト、その1000倍がエクサバイトである。YouTubeの動画のストレージが2025年に1〜2エクサバイト必要になると予想されていることと比べてみても、ゲノムのデータサイズは蓄積されると非常に大きいことが分かる。

5)NATURE NEWS 07 July 2015