子宮鏡検査を子宮体がん検出に活用するAIシステム開発、感度最高で91.66% 東京大学とサイオス子会社

  東京大学とシステム開発会社が、子宮鏡検査で得られる画像をAI(人工知能)で学習させ、子宮体がんの診断支援に寄与するシステムを開発した。複数の深層学習モデルを組み合わせ同時に稼働させることで、少ない症例数でも感度の高い検出結果を導いたことに特徴がある。両者はさらに精度を高めるため、今後多施設共同研究を開始する予定。

177症例を深層学習モデルの複数同時稼働で解析 精度向上へ導く

 システムを開発したのは東京大学医学部附属病院女性診療科・産科の曾根献文講師(研究室リーダー)らと、システム開発会社のサイオステクノロジーの子会社で、バイオ・医療分野用のAI研究開発を主幹業務とするPredicthy合同会社。子宮体がんのスクリーニングには、現在主に子宮体部の細胞診が活用されているが、子宮頸がんの細胞診と比較して正診率が高くなくスクリーニングとして確立されたとはいえない状態で、早期発見に有用な別の手法が求められている。

 そこで研究チームは、現在主に子宮筋腫やポリープなどの良性腫瘍の診断、着床不全の原因検索に活用されている子宮鏡検査とそこで得られる画像に着目した。腟を経由して子宮内腔を細径のファイバースコープを用いて観察する子宮鏡検査は外来で麻酔なしで行える簡便な検査法で、子宮体がんの診断や、その前癌病変である子宮内膜増殖症の診断補助に使用している実績がある。研究チームは子宮体がん検診の重要なデバイスとして子宮鏡検査を一般化することを目的に掲げ、深層学習を用いた子宮鏡における子宮体癌自動診断システムを開発に取り組んでいる。また膨大な症例数を用意できなくとも、正診率を向上できる独自アルゴリズム開発も目指した。

図 1.子宮鏡画像(5つの疾患の画像例)
図2.本研究におけるフローチャート

 今回の研究では、東大病院が持つ子宮鏡検査時の動画177症例(正常子宮内膜:60 例、子宮筋腫:21 例、子宮内膜ポリープ:60 例、子宮内膜異型増殖症:15 例、子宮体癌:21 例)を対象とし、全例の動画を約40万の静止画に変換。それらの画像を悪性グループ(子宮内膜異型増殖症、子宮体癌)、非悪性グループ(正常子宮内膜、子宮内膜ポリープ、子宮筋腫)に分け深層学習を実施した(図1、図2)。学習には3種類のネットワークモデル(Xception、MobileNetV2、EfficientNetB0)を用い、それらの比較も行った。

図3. 連続法+ネットワークモデル組み合わせ法による子宮鏡画像の正診率

 まず標準のアルゴリズムで評価したところ、正診率は約80%程度となり、各ネットワークモデル間の正診率に大きな差は生じなかった。次に、少ない症例数で正診率を上げる手法として「連続法」というアルゴリズムを開発し検証した。連続法とは50枚以上連続で画像が悪性として分類された場合、その症例を悪性と判定するもので、この手法を用いた場合の正診率は85%以上だった。研究チームはさらに正診率を上げる別の手法として「ネットワークモデル組み合わせ法」も検証した。これは3種類のネットワークモデルを複数回学習させて得られた72個のモデルを同時稼働させ、どれか1つのモデルが悪性と判定した場合、その症例を悪性と診断するもの。この方法により、正診率(感度)を最高91.66%、特異度を89.36%にまで向上させることができたという(図3)。

 研究チームでは今後、正診率を100%近くまで向上させるため多施設共同研究を開始する予定としているほか、このシステムをを搭載した子宮鏡の実用化も目指すとしている。なおこの研究成果は、PLOS ONEのオンライン版に2021年3月31日付で掲載された。

※ネットワークモデル:深層ニューラルネットワークの構造は多数提案されており、代表的な構造には名称が付与されるが、総じて「ネットワークモデル」と呼ぶ。

外部リンク(論文):Automated system for diagnosing endometrial cancer by adopting deep-learning technology in hysteroscopy(PLOS ONE)