同じ脳腫瘍MRIレポートでChatGPTと放射線科医の診断能力を比較!その結果は
ChatGPTの医療への応用が期待されているが、同じ脳腫瘍のMRI画像レポートを用いてChatGPTと専門医の診断/鑑別能力を比較するという刺激的な研究報告が日本の研究グループから発表された。果たしてその結果は。
ChatGPTが医師と最終診断でほぼ同等、鑑別診断では上回る
研究成果を発表したのは、大阪公立大学大学院 医学研究科放射線診断学・IVR 学の光山 容仁大学院生(博士後期課程 3 年)、人工知能学の植田 大樹准教授らの研究グループ。医療現場から収集した脳腫瘍術前 MRI 画像レポートを対象に、ChatGPT と放射線科医の脳腫瘍診断能力を比較したという。
具体的には、2 つの医療機関から2017年〜2021年の手術前の脳腫瘍患者の脳腫瘍術前 MRI 画像レポート 150 件を収集。GPT-4 を基盤とした ChatGPT と 5 人の放射線科医(脳神経画像を中心に画像診断を専門とする神経放射線科医 2 名、脳神経画像診断以外が専門分野、あるいは研修中である一般放射線科医 3 名)が、同じ MRI レポート(テキストのみ)について、3 つの鑑別診断と 1 つの最終診断を行った。手術で切除された腫瘍の病理診断を正解として確認した結果、最終診断の精度は ChatGPT が 73%、神経放射線科医の平均は 72%、一般放射線科医の平均は 68%だった。また鑑別診断の精度は、ChatGPT が 94%、神経放射線科医の平均は 88%、一般放射線科医の平均は 77%だった。
なお神経放射線科医が作成したレポートを使用した場合の ChatGPT の最終診断の精度は80%で、一般放射線科医が作成したレポートを使用した場合の 60%と比較して高い精度を示した。鑑別診断に関しては、神経放射線科医が作成したレポートを使用した ChatGPT の精度は95%で、一般放射線科医が作成したレポートを用いた場合の 93%と同等だった。
研究グループは結果について、ChatGPT が脳腫瘍術前 MRI 診断に有用であることが示唆されたとし、また、ChatGPT は神経放射線科医のような専門的知識や経験を有するものが作成した入力情報を用いることで、より高い精度で診断できることが分かったとしている。