「グラフチャート図」でAIの判定結果を説明可能に、臨床利用でスクリーニング精度向上

 AI(人工知能)の解析結果の根拠を説明できる新たな技術が開発された。日本の研究グループが、胎児の超音波検査において異常所見の有無を判定する際、判定の根拠となる診断部位の検出結果を「グラフチャート図」化することで、従来手法よりも明確に提示することが可能になったと発表した。実際に複数の臨床医がグラフチャート図を参考にしたところ、胎児心臓の超音波スクリーニングの精度が向上したという。

ディープラーニングによる解析結果の表現を拡張、臨床におけるスクリーニング精度向上の可能性示す

 研究成果を発表したのは、理化学研究所(理研)革新知能統合研究センター(AIP)目的指向基盤技術研究グループがん探索医療研究チームの小松正明副チームリーダー、浜本隆二チームリーダー、理研AIP-富士通連携センター[1]の酒井彬客員研究員、昭和大学医学部産婦人科学講座の松岡隆准教授、小松玲奈助教らの共同研究グループ。超音波検査は簡便性・非侵襲性・リアルタイム性に優れ幅広い医学領域で使用されているが、超音波検査ではプローブを手動走査して画像を取得するため、検査者間での診断技術の差異が大きいこと、また超音波画像は音響陰影(影)の影響を受けやすく、画質劣化および診断精度の低下につながることなど特有の課題がある。

図1 オートエンコーダを用いたグラフチャート図の作成
カーネルを検査時間経過に添ってバーコード上を右方向にスライドさせ、部位構造の検出情報を抽出する。その検出情報をオートエンコーダ(エンコーダ・デコーダ)に入力して二次元データに圧縮し、その分散表現の軌跡をプロットすることで、グラフチャート図を作成する(カーネル:黄緑丸、移動方向:赤矢印)。また、グラフチャート図の内面積(緑色)を用いて異常度スコアを算出する。

 共同研究グループは2018年度より、胎児心臓超音波スクリーニング診断支援に向けたAI基盤技術の研究開発に取り組んでいるが、今回、AIの判定結果の説明可能性を向上させるため、以前開発した「部位検出結果のバーコード表示」(リンクは論文)※1をさらに拡張する技術開発に取り組んだ。具体的には、代表的な教師なし学習※2である「オートエンコーダ※3」を用い、バーコードから得られた分散表現※4を解析することで新しい説明可能な表現「グラフチャート図」を開発した。

 生成原理としては、カーネル※5を検査時間経過に添ってバーコード上をスライドさせ、部位構造の検出情報を抽出してオートエンコーダに入力。検出情報は二次元データに圧縮され、その分散表現の軌跡をプロットすることでグラフチャート図を作成する。グラフチャート図を作成する際には「view-proxy loss※6」と呼ぶ新指標を導入し、この値が高まらないよう最適化することでオートエンコーダの学習を安定化させ、分散表現の軌跡が絡み合うことのないように工夫した。さらに、グラフチャート図の内面積を用いて異常度スコア※7を算出する。なお、手動検査によるプローブの手振れなどについては、グラフチャート図では同一の軌跡をたどるため影響を最小化できる。

図2 階層型グラフチャート図
正常胎児の大血管(a)心臓(b)、および先天性心疾患(ファロー四徴症)の大血管(c)心臓(d)の階層型グラフチャート図。四腔断面(four-chamber view: 4CV)は青菱形点、三血管気管断面(three-vessel trachea view: 3VTV)は赤四角点で表示している。この先天性心疾患症例では、大血管においてより大きな差異が示唆された。

 研究グループでは実際に、検査者がグラフチャート図および異常度スコアを参考にすることで、胎児心臓超音波スクリーニングの精度向上が見られるのかを検証した。昭和大学病院産婦人科の専門医8名、一般産婦人科医10名、後期研修医9名の計27名の協力で、ランダムな胎児心臓超音波スクリーニング動画40動画について正常・異常判定し、また判定を下す際の確信度(検査者自身が判定に対してどの程度確信を持っているかを示す値)を5段階評価で記載する調査を実施。検査者が単独で読影した場合と、グラフチャート図および異常度スコアを併用して読影した場合とで比較したところ、受信者動作特性(ROC)曲線※8の曲線下面積(AUC)※9の算術平均において、専門医で0.966から0.975、一般医で0.829から0.890、後期研修医で0.616から0.748へと、全ての検査者レベルでスクリーニング精度の向上が見られた(図2)。

 研究グループは、この成果は「説明可能なAI」によって胎児心臓超音波スクリーニング精度を向上させた世界初の報告であるとしており、これまで構築してきた基盤技術と統合することで実用化を目指すとしている。

※1 Detection of Cardiac Structural Abnormalities in Fetal Ultrasound Videos Using Deep Learning(Applied Science)
※2  教師あり学習、教師なし学習
機械学習において、人間が正解ラベルを与えたラベル付きデータからその特徴を学習する方法を教師あり学習と呼ぶ。一方、教師なし学習では正解ラベルを与えずに学習し、次元圧縮によりデータの特徴を抽出する。
※3 オートエンコーダ
深層学習における代表的な教師なし学習手法。エンコーダ、デコーダと呼ばれるニューラルネットワークからなり、入力データをエンコーダにより特徴量へ変換し、特徴量をデコーダにより入力データへと再構成(復元)する。
※4 分散表現
解析対象データをある次元のベクトル空間に埋め込み、その特徴を同一空間上の実数ベクトルで表現すること。
※5 カーネル
画像処理において画像の一部をスライドしながら切り出して、平均化などの処理をする関数。
※6 view-proxy loss
オートエンコーダによって生成されたグラフチャート図では、分散表現に対するガイドラインがないため、その軌跡は絡み合った形状となる傾向がある。そこで、超音波検査において臨床的に重要な診断面の理想的な座標と、抽出された部位構造の検出情報の分散表現との間の距離をview-proxy lossとする。この新しい指標を最小限に抑えることで最適化し、オートエンコーダによる学習を安定させ、より鮮明なグラフチャート図の作成が可能になる。
※7 異常度スコア
正常所見からの逸脱の程度を数値化したもの。本研究では正常を0、異常を1と設定し、0から1の範囲で算出している。
※8 受信者動作特性(ROC)曲線
ある検査において、正常と異常を判別するカットオフポイントに応じて、検査の性能を視覚的に表したもの。縦軸に真陽性率(感度)、横軸に偽陽性率(1-特異度)を尺度としてプロットする。スクリーニング検査などの精度評価や従来検査との比較に用いられる。ROCはreceiver operating characteristicの略。
※9 曲線下面積(AUC)
ROC曲線を作成した際の、グラフの曲線より下の部分の面積のこと。0から1までの数値をとり、1に近いほど判別性能が高いことを示す。AUCはarea under the curveの略。

論文リンク:Medical Professional Enhancement Using Explainable Artificial Intelligence in Fetal Cardiac Ultrasound Screening(Biomedicines)