宮崎大、NTTデータ、ファイザーの研究グループが、複数医療機関の電子カルテデータに適用可能な、肺がん患者の薬物治療効果を判定するAIモデルを構築した。電子カルテの非構造化データを自然言語処理して薬物治療効果を抽出するもので、このAIモデルで抽出した薬物治療効果から算出した臨床研究の評価項目は、人が抽出した結果と同様の傾向を示すことを確認しているという。
大規模言語モデル「BERT」でAIモデルを構築
研究グループの3者は、非構造化データを用いた臨床アウトカムの評価手法の確立に向け、2020 年から共同研究を進めている。今回、宮崎大学の電子カルテデータから、同大学医学部附属病院に通院または入院した、肺がん患者31例の電子カルテデータを対象に医師が評価した学習データを作成。文脈情報が考慮可能な大規模言語モデル「BERT」を用いてAIモデルを構築した。この時点で精度検証したところ、感度 0.63、陽性的中率 0.42、F1スコア 0.50だった。
次に、複数医療機関の電子カルテデータにおいて活用可能か検証するため、次世代医療基盤法に基づく認定匿名加工医療情報作成事業者「一般社団法人ライフデータイニシアティブ(LDI)」が保有する多施設電子カルテデータベースに保管されている6つの医療機関のデータ(肺がん患者713例)を対象とし、AIが抽出した薬物治療効果から、臨床研究で用いられる評価項目である疾患進行までの時間(Time-to-Progression disease、TTP)を治療ラインごとに評価した。
その結果、開発したAIモデルが複数医療機関の電子カルテデータに適用可能であること、抽出した薬物治療効果から算出した臨床研究の評価項目は、人が抽出した結果と同様の傾向を示すことを確認した。研究グループはこれらの結果から、今後、治療効果の薬剤間の比較や肺がん以外の疾患の薬物治療効果判定等に、非構造化データの活用が広がる可能性が見込めるとしている。
論文リンク:
Developing Artificial Intelligence Models for Extracting Oncologic Outcomes from Japanese Electronic Health Records(Advances in Therapy)
Real-world treatment response in Japanese patients with cancer using unstructured data from electronic health records(Health and Technology )