東京大学医科学研究所は、半導体メーカーであるエヌビディア(NVIDIA)のシステム導入により、がん診断などに活用するゲノムデータ解析時間を1/5に短縮した。2021年2月、同研究所 ヒトゲノム解析センター所長の井元清哉氏がエヌビディアと共に実施したオンラインセミナーで報告した。

 東大医科研のヒトゲノム解析センターでは、「SHIROKANE」と呼ぶスーパーコンピューターを導入し、ゲノム解析を行っている。今回、高速化の対象になったのは、ゲノム情報の「二次解析」プロセス。次世代シーケンサーでゲノム情報を読んだ後、エラー補正した上でゲノムの異常を特定していく解析である。エヌビディアの画像処理半導体であるGPU、および専用のソフトウエアである「Clara Parabricks」の導入により、この二次解析に要する時間を1/5に短縮した。

ShirokaneのGPUノード(提供:東京大学医科学研究所ヒトゲノム解析センター)

 高速化したゲノム解析システムは、SHIROKANEの有償外部利用者である研究機関など1800カ所に公開していく。井元氏によると「例えば、病態進展が早い白血病においては、1週間のうちに治療のプラニングをしたいニーズがある。データ解析に10時間かかっていたのが100分ほどに短縮できる。国内で2017年に新たに診断されたがんは97万7293人で、全ゲノムシーケンスデータ解析は高いニーズがある」と語る。

「アノテーション」プロセスの高速化も

 ゲノムデータは、がんにとどまらず、新型コロナウイルス感染症の患者が重症化するか否かにも生かせる可能性がある。井元氏は、「イタリアとスペインで重症新型コロナウイルス感染症患者の遺伝的な背景について論文報告されている」と説明する。

東京大学医科学研究所ヒトゲノム解析センターセンター長の井元清哉氏

 現在、東京大学医科学研究所も参加する「コロナ制圧タスクフォース」の中で、日本人集団やアジア人集団での新型コロナ重症化や死亡率との関与についての遺伝的解析のプロジェクトが進んでいるという。これに向けて、2020年3月にはSHIROKANEの計算リソースの無償提供を始めている。

 エヌビディアでは、今回高速化した二次解析のプロセスだけではなく、二次解析によって特定した異常の臨床的な意義を解釈する「アノテーション」のプロセスの高速化も進めるとしている。


(タイトル部のImage:monsitj -stock.adobe.com)