近年医用画像をAIで読影支援したり、読影レポートを自動生成するなどの支援技術が盛んに開発されているが、読影レポートの「質」に関しての課題共有が進んでいないとの指摘がある。奈良先端科学技術大学院大学の研究グループが、その課題の顕在化と今後の研究を促進させるため、一つの画像に対する複数の読影レポートからなるデータセットを作成し、一部をWebで公開した。
データセットを作成したのは、奈良先端科学技術大学院大学ソーシャル・コンピューティング研究室の荒牧英治教授らの研究グループ。近年、AIを用いてレントゲン、CT、MRIなどの医用画像から読影レポートを自動生成する研究が盛んになっているが、しかし、現存する評価方法で生成物に点数付けをすると、医学的な妥当性とは必ずしも一致しないことがみられる。研究グループはこの要因として、読影レポートの質の定義が難しく、また、同じ診断内容でも文章としてさまざまな書き方ができること(表現の多様性)にあると推定し、同一のCT画像に対して複数名の読影医に読影レポートを作成してもらうという独自の研究を行った。
今回は、CT画像から肺がんの進行度を国際対がん連合(UICC)が提案するTNM分類※1によって判定するという一つの要素に絞り、医学的内容に応じどのような表現方法が存在するのかを収集することを目的とした。具体的には、放射線医学関連情報・教育サイト「Radiopaedia (http://radiopaedia.org) 」で無料公開されている肺がんCT画像を15個選び、それぞれに対し9名の読影医に読影レポートを作成してもらい、計135文書を収集した。その一部をサンプルとしてWebサイト (https://sociocom.naist.jp/j-medstd/rr/) にて公開している。
研究グループでは、後悔したデータを通じ、医療AIが医学的内容の正しさを考慮しながら読影レポートの自動作成ができるようになったり、医学的内容を読み取ったうえで読影レポートの品質を評価したりできるようになることが期待できるとしている。
※1 TNM分類:癌の進行度(病期、ステージ)を決定するために広く用いられている方法。癌のサイズと周囲臓器への浸潤度(T因子)、リンパ節転移(N 因子)、遠隔転移(M因子)の3因子を評価し、これらの因子を組み合わせることによって癌の進行度を決定する。たとえばT因子がT1c、N因子がN0、M因子がM0となる癌の進行度をTNM分類で表現すると「T1cN0M0」となる。