DeepMind、「AlphaFold」を大幅拡張 既知のタンパク質のほぼすべて、2億以上の構造を検索可能に

 米Alphabet傘下のAI企業DeepMindが、タンパク質構造予測AI「AlphaFold」に収蔵するデータを大幅に強化し、ヒトプロテオームを含む既知のタンパク質2億以上の構造データを検索できるようになったと発表した。さらにこの拡張されたデータもこれまでと同様、研究者に自由に使えるようにGitHubに公開している。

公開当初よりデータ数が200倍以上、生物種をまたぐ唯一最大のデータベースに

 2020年にDeepMindが発表したタンパク質構造予測AI「AlphaFold」の成果は、ここ50年来の生物学上の一大命題である「タンパク質の折りたたみ問題」を、比較的安価にコンピュータのみで解決しうるものとして、世界中の研究者から驚きと賞賛をもって受け止められた(既報)。今回DeepMindは、すでに公開している「AlphaFold Protein Structure Database」を大幅に増強し、科学的に知られているほぼすべてのタンパク質、2億以上の構造を検索できるようにしたと発表した。

(AlphaFoldで実際に検索・表示できるタンパク質構造予測3Dデータの一例)

DeepMindによると、現在までに190ヵ国50万人を超える研究者がAlphaFold DB にアクセスし、200 万を超える構造を閲覧しているという。具体的な研究にも寄与していることが引き続いて明らかになっており、例えば Drugs for Neglected Diseases Initiative (DNDI)では、リーシュマニア症やシャーガス病など、貧困地域に集中してみられる疾患の治療法開発を前進させ、世界保健機関(WHO)が提唱している「World Neglected Tropical Disease Day」を支援するため、ハンセン病や住血吸虫症など研究を促進させる関連データを作成・提供するなどしている。

DeepMindは発表の中で「病気との闘いからワクチンの開発まで、AlphaFold はすでに世界最大の課題のいくつかで驚異的な進歩を遂げている。これは始まりに過ぎない」とこの取り組みに自信を見せており、同社自身もこのデータベース、AIを活用する取り組みを推進するとしている。具体的にはグループ内のIsomorphic Labsと提携し、AI ファーストのアプローチで創薬プロセス全体を再構成する研究を行うなど多くの分野に投資するとした。

関連リンク:
AlphaFold Protein Structure Database
deepmind/alphafold(GitHub)
Highly accurate protein structure prediction with AlphaFold(Nature)
Highly accurate protein structure prediction for the human proteome(Nature)