医療情報をクレンジングなしで容易に統合、AIで経過を高精度予測 Googleの研究

Googleが今回開発した新しい医療情報のフォーマットの概要(出典:Google AI Blog)

Google、カリフォルニア大学サンフランシスコ校、シカゴ薬科大学、スタンフォード大学のメンバーからなる研究チームは、先ごろ科学誌「Nature」の姉妹誌であるDigital Medicine誌に、新しい医療情報の統合手法と、それを前提にしたディープラーニングによる入院患者の経過予測アルゴリズムについての論文を投稿した。

異なる形式のデータを患者の「タイムライン」へ統合

チームでは論文の中で、今回の研究では大きく2つの成果があったとしている。ひとつめはEHR(Electric Health Record:電子カルテ等の電子化された医療情報)の形式にかかわらず、手動での調整なしに、米国内の医療情報の情報交換規格「FHIR(Fast Healthcare Interoperability Resource)」に対応したこと。研究では2つの病院のEHRを対象としたが、従来手法の項目のマッチングや不適合な項目の破棄といった、いわゆる「クレンジング」は行わず、いったんすべてのレコードを展開したあと統合するという手法をとった。

「FHIR」フォーマットについての論文での説明図 https://www.nature.com/articles/s41746-018-0029-1

具体的には、米国内の2つの大学病院が所有する述べ約216,000人の成人患者のデータに含まれる個々の記録をいったんすべて独立させ、フリーテキストも含む約468億もの個別データに展開。自動でFHIRに適合した構造を持つ、患者をキーにしたタイムラインのデータに変換した。従来の手法ではデータを整えるために多くの情報を破棄していたが、それ自体がデータ解析の精度を下げていたとし、この手法であれば医療情報のすべてをディープラーニングによる解析に投入でき、解析精度が上がるのではと仮説を立てた。

ディープラーニングによる患者経過予測で従来手法を上回る精度を達成

ふたつめの成果は、この新しいデータ体系をディープラーニングによる予測モデル確立に活用し、入院患者の経過予測精度の向上を証明したことだ。予測モデルの評価指標として標準的に使われるAUC(Area Under the Cover:ROC曲線下面積の広さで精度を評価する指標)で、院内死亡率、退院患者の計画外再入院率、入院長期化率について従来の予測モデルと比較したところ、以下のような結果になったという。

 

予測項目 AIによる予測モデル 従来手法※
院内死亡率 0.95(病院A)/0.93(病院B) 0.85(病院A)/0.86(病院B)
計画外再入院率 0.77(病院A)/0.76(病院B) 0.70(病院A)/0.68(病院B)
入院長期化率 0.86(病院A)/0.85(病院B) 0.76(病院A)/0.74(病院B)

 

 

このように、従来手法と比べ有意に高精度な予測ができたとし、この手法はさまざまな臨床シナリオに対して、正確かつスケーラブルなAIによる予測モデルの確立に活用できるとした。ただこの研究について報告したブログでは「この結果は過去のデータを使ったごく早期のものであり、ディープラーニングを活用して医療をより良くできるかという仮説検証の端緒に過ぎない。医師が目の前にいる患者のケアにより集中できたり、患者がどこにいても高品質のケアを受けられる手助けになるか、今後も医師や患者の協力を仰ぎながら研究を進めたい」としている。

※従来手法=院内死亡率はaEWS、計画外再入院率はmodified HOSPITAL、入院長期化率はmodified Liu