情報・システム研究機構 データサイエンス共同利用基盤施設 ライフサイエンス統合データベースセンター(DBCLS)の小野浩雅 特任助教、坊農秀雅 特任准教授、情報・システム研究機構 国立遺伝学研究所の小笠原理 特任准教授、大久保公策 教授の研究グループは、 遺伝子発現解析の基準となる各遺伝子の遺伝子発現量を簡単に検索、閲覧できるウェブツール「RefEx」を開発したと発表した。
最大 556 個の臓器・細胞における遺伝子発現状況をワンタッチで
現在、生命科学分野においては、誰でも利用可能なデータが公共データベースとして多数存在しているが、実際にそれらを自らの研究に利用しようとしたときどれを使うべきか分からないという課題がある。特に遺伝子発現データは、DNAマイクロアレイの発明によりゲノム規模の測定が可能となってから、さまざまな研究グループにより異なる測定手法を用いて産生されたデータが、指数関数的に蓄積していた。大量の遺伝子発現データ の中からまずどれを選び、調べればよいのかの指針になりうる代表的な遺伝子発現量データ セット、あるいはリファレンスデータが必要とされている状況だ。
このような課題に対するソリューションとして、研究グループが開発したのが「RefEx」。複数の遺伝子発現計測手法によっ て得られた哺乳類の正常組織、細胞等における遺伝子発現データを収集し並列に表現することで、各組織における遺伝子発現状況を計測手法間の差異とともに直感的に比較できるのが特長。
トップページ(検索フォーム)、検索結果一覧、個別の遺伝子の詳細情報、の 3 つが柱だ。ヒト、マウス、ラットの 3 種の生物種に対応している。検索結果一覧および個別の遺伝子の詳細情報ページでは、 組織間の比較と測定手法間GeneChip ※1、CAGE ※2 、RNA-seq ※3の比較を両立させた相対発現量が棒グラフで示されるとともに、人 体の 3D モデルに発現量を反映させたヒートマップが表示される。検索結果一覧や詳細情報ページのデータはいずれもダウンロードすることが可能で、手元の データと参照することも、それらを使った再解析も自由。さらに最近公開された、理化学研究所の FANTOMプロジェクト 5(FANTOM5) ※4 の遺伝子発現データもRefEx に収載されている。これらの FANTOM5 データは、ゲノムにコードされているプロモーターと転写因子制御ネットワークを 明らかにすることを目的として得られ、それらを閲覧できるウェブサイトも公開されているが、多くの生命科学研究者にとってはその規模の大きさと複雑さから再利用が難しいものであった。RefEx を通じ、これらの高精度かつ広範囲な組織や臓器(ヒトで 556 種)における遺伝子発現データについても、可視化および比較を簡単に行えるようになった。なおRefEx の使い方は以下の動画でも公開されている。
今後は、世界各地で進められている遺伝子発現に関する大規模研究プロジェクト(FANTOM、 GTEx、Human Cell Atlas など)を中心に、高精度かつ広範囲な遺伝子発現データを収集し、 統合することで、より有用性の高い参照データの作成を進める予定だ。なおこのプロジェクトに関する論文はScientific Data誌に掲載されている。
※1 GeneChip
Affymetrix 社(現 ThermoFisher Scientific 社))のマイクロアレイ。公共データベース中 の多くのデータは現状この GeneChip によって測定された遺伝子発現データである。※2 CAGE
Cap Analysis of Gene Expression の略。mRNA の 5’末端を選択的に配列解読する方法で、 転写開始点の特定に用いられるほか、その末端に付与した印の数を数えることで遺伝子発現量 の測定も可能となる。※3 RNA-seq
次世代シークエンサーによって塩基配列解読することで遺伝子発現量を測定する方法。※4 FANTOM
Functional ANnoTation of Mammalian genome の略で、理化学研究所が中心となって行われてきた、転写産物の機能解析やアノテーションなどを行う国際的な共同研究プロジェクト。