東京大学医科学研究所 ヒトゲノム解析センターは、日立製作所の協力のもと全ゲノムデータ解析の高速化に向けた検証を実施し、解析時間を従来比約80%削減することに成功したと発表した。従来10時間以上を要していた解析時間を最短1時間45分に短縮できたという。
がんゲノム医療におけるヒトゲノム全解析を検証
現在、日本のがんゲノム医療では、これまでの研究からがんとの関係性が明らかになっている数百規模の遺伝子のゲノム配列を調べることができる「遺伝子パネル検査」が使われている。しかしヒトには約2万1千個の遺伝子があり、全ての遺伝子は調べられていない。また、仮に全遺伝子を調べたとしてもその割合は全ゲノム領域のたった2%程度に過ぎず、ゲノム上には「遺伝子パネル検査」では調べていない領域が膨大に存在している。
近年の最先端の研究では、遺伝子以外のゲノム領域に生じた変異もがんを生じさせる原因となることも明らかになってきており、将来のがんゲノム医療には、全ゲノム情報解析が必須となると考えられている。しかしこの解析には現在ある最高スペックのスーパーコンピュータでも膨大な時間がかかる作業であり、さらなる高度な解析基盤や手法の開発が求められている。
このような課題に対し、今回、東大医科研ヒトゲノム解析センターの有する最新型のヒトゲノム解析用スーパーコンピュータシステム「Shirokane5」※を活用し、日立の協力のもと、全ゲノムデータの解析時間の短縮に向けた検証を行った。Shirokane5の持つ高速度計算能力とゲノムデータ解析プログラム、東大医科研がこれまで開発してきたがんゲノム医療のワークフローを組み合わせることにより、従来10時間以上を要していた解析時間を約80%削減し、最短1時間45分での解析に成功したという。これにより、患者よりゲノム解析の同意を受けてから、ゲノム医療の結果を担当医に返却するまでに要する最短期間が、従来の「3日と7時間30分」から「2日と16時間」へ大幅に短縮可能になったとしている。
医科研では、現在科学研究において、全ゲノム情報を用いた成果が次々に出ているものの、膨大な情報解析の負担がこの成果を医療に還元する際の障壁の一つだったとしており、本検証の成果は、全ゲノム情報を最大活用した将来のがんゲノム医療の実現に大きく貢献するものだとしている。
※ Shirokane5:東大医科研が2019年3月から運用している、1.78PFLOPSの総合理論倍精度演算性能を実現するスーパーコンピュータ。今回の検証においては、ヒトゲノム情報の高速な並列処理を行うプログラム用には合計13,176 CPUコアを有する「分散メモリ型サーバ」、AIによる高速なゲノム解析を行うプログラム用に合計NVIDIA Tesla V100 80基を有する「GPU搭載サーバ」、ヒトゲノムアセンブリプログラムといった大容量のメモリを必要とするプログラム用には1ノードあたり3TBのメモリ容量を有する「大規模メモリサーバ」を有している。