ディープラーニングの学習結果を「逆解析」して診断精度向上、理研・日本医大ら
理化学研究所(理研)、日本医科大らの共同研究グループは、医師の診断情報が付いていない病理画像をディープラーニングで学習させたあと、がんに関わる知識をAIが自力で獲得する技術を開発し、がん再発の診断精度を上げる新たな特徴を見つけることに成功したと発表した。医療分野でのディープラーニングによる学習結果は根拠が不明であるとして臨床に活用するには課題があるとされており、その解決の一歩になることが期待される。
AIだけで診断に関する新たな発見も獲得
研究成果を発表したのは、理化学研究所(理研)革新知能統合研究センター病理情報学チームの山本陽一朗チームリーダー、日本医科大学泌尿器科の木村剛准教授らの共同研究グループ。人工知能の医療分野への活用は日本でも普及期に入ろうとしているが、現在は医師が教えた診断をAIが学習する「教師あり学習」と呼ばれる手法が主流であり、教師以上の分類はできないという限界がある。他方、他分野で主流である教師データなしのディープラーニング(深層学習)では、得られた結果の医学上の根拠が不明であり、臨床で使用できないという根本的課題があった。
そこで研究チームは新たな手法として、医師の診断を必要としないディープラーニングにより獲得した特徴を、人間が理解できるように変換、変換したデータに対し、さらに別の機械学習で最適な重み付けを行わせることで、これまで不可能であったがんの未知なる情報の獲得を目指した。具体的には医師の診断情報が付いていない100億画素を超える全包埋・全割した前立腺の病理画像(AI学習用の分割画像にすると、合計約11億枚に相当)に対してディープラーニングにより特徴量を分類させたのち、再発期間のみを用いた重み付けをさらに別の機械学習(非階層型クラスタリング)を用いて行い、病理画像と予後情報のみから、詳細に分類されたがんの情報を抽出させることに成功した。AIが作成した分類には、現在世界中で使用されているがん分類(グリソンスコア)が含まれており、さらに、これまで専門家も気づいていなかった「がん領域以外の間質の変化」も、がんの再発の診断精度を上げる特徴として読み取られていた※1。
医師の知見とAIの併用でさらに診断精度向上
次に、開発した新しいAIが見つけたこれらのがんの特徴が、再発予測に役立つかを確認するため、日本医科大学病院の20年間分の13,188枚の前立腺の病理画像(AI学習用の分割画像にすると約860億枚に相当)を用い、がんの予後予測の検証を行った。その結果、現在世界中で使用されている前立腺がんの診断基準(AUC※2= 0.744)よりも高い精度(AUC = 0.820)で再発予測ができることが分かった。
さらに、日本医科大学病院の症例だけを用いてAIに学習させた結果が、聖マリアンナ医科大学病院と愛知医科大学病院においても利用できるかどうかを調べた。これら2つの大学病院の2,276枚の前立腺の病理画像(AI学習用の分割画像にすると約100億枚に相当)に対して検証したところ、日本医科大学における予測精度とほぼ同等の再発予測ができた(AUC = 0.845)。最後に、AIが見つけた特徴と病理医の診断を組み合わせて再発予測をしたところ、それぞれが単独で予測するよりも、さらに予測精度を上げること(施設内検証:AUC = 0.842、多施設による検証:AUC = 0.889)ができた(図2)。この結果は、AIと人間は病理画像の解析に対して得意とする点が異なり、補完し合うことで精度を上げることが可能だということを示しているという。
研究チームはこの新しいAI技術について、術後の高精度ながんの再発予測法として、個々に合った治療選択に貢献するとともに、画像から新たな知識を獲得するための自動解析手法として役立ち、さらにブラックボックスといわれているAIの解析根拠をひも解く一歩となると展望を示している。なおこの研究成果は、米科学雑誌Nature Communicationsに2019年12月18日付で掲載された。
※1 AIにより見つけられた病理学的特徴は論文の中で、AIが作成した初めての病理画像アトラスとして閲覧できる。
※2 AUC
Area Under the Coverの略で、検査などの性能を表す際に使用されるグラフの一つであるROC(Receiver Operating Characteristic)曲線を作成したときの、グラフ下部の面積のこと。0から1までの値をとり、値が1に近いほど判別能が高いとされる。