AMEDと東北メディカル・メガバンク機構、運用中のスーパーコンピュータを部分開放、全国の研究者が利用可能に
機能も大幅拡張、世界有数の複合バイオバンク基盤へ
解析技術の急速な進展等によりライフサイエンスに関わるデータ量は膨大となり、研究にはビッグデータの解析、つまりスーパーコンピュータの利用が必須となりつつある。しかしスーパーコンピュータを所有できる研究組織は限られ、多くの研究者が計算資源の確保に苦慮している。
この課題を解決するため、ToMMoはAMEDからの委託のもと、運用中のスーパーコンピュータの更新に取り組んだ。従来の東北メディカル・メガバンク計画推進のためのゲノム・オミックス解析、情報の保管、分譲に加え、全体の2/3を公開・分譲区画(外部からアクセス可)とし、AMEDが推進する「疾病克服に向けたゲノム医療実現プロジェクト」における供用のほか、全国の研究者が利用可能なものとした。この更新は、昨今重要性が叫ばれるデータ及び計算・解析機能の共有(シェアリング)に対応したものだという。
具体的には、計算ノード数に関しては台数を最適化し、GPUを16基から24基(1台あたり8基搭載しているNVIDIAのDGX-1(Volta)を3台導入)。理論演算性能がGPUとして10倍(倍精度で18,720GFLOPS→187,200GFLOPS)を達成した。Voltaは半精度(FP16)計算に適したTensorコアを有しており、ディープラーニングに適した構成となった。ストレージは既存システムの19.4PBを一部利用停止したうえで21PB増強し、合計27PBに到達。うち、データシェアリングに利用している容量は4.2PBから8.5PBと倍増したという。さらにバックアップ用のテープカートリッジも従来の14PBに加え、15PBを増強し、合計29PBとした。CPUはスーパーコンピュータとしては最新世代のSkylakeを導入し、前システムから3世代更新された。
今回構築・更新されたシステムは、解析区画、分譲・共同利用区画、公開区画に分けられ供用される。分譲・共同利用区画については遠隔セキュリティエリア(入退室管理、生体認証等でセキュリティを強化しているエリア)からの利用、公開区画はインターネットから全国の研究者がアクセス・利用可能になる予定だ。