「会話型 認知症診断支援システム」臨床試験結果発表、MMSEを超える判別能を達成

 慶應義塾大学とAI(人工知能)構築ソリューションを展開するFRONTEOは、同社開発の「会話型 認知症診断支援AIシステム」の臨床試験結果を発表した。従来の判定スケールのように構造化した試問や発話内容の特定は必要なく、自由な会話を数分行うだけで診断できるうえ、既存の判定スケールよりも高精度な判別能を示したとしている。

「会話型 認知症診断支援AIシステム」とは

FRONTEO社Webサイトにあるサービス説明ページより

 同社が今回治験届を提出した「会話型 認知症診断支援AIシステム」は、同社の基幹技術である言語解析技術「Concept Encorder」を元にしている。同技術は「単語や文書のベクトル化」でヘルスケア領域の自然文を数値化して解析する技術で、臨床現場での患者との会話をテキストデータ化することを前提に応用することを想定しており、患者と医師の5〜10分程度の日常会話を書き起こした上で解析することで、認知機能障害をスクリーニングできるという。また、特にその際に話題を限定する、決められた試問を行うなどの構造化やルールは必要なく、決められた会話を繰り返すことで起きる「学習効果」の心配もない。慶應義塾大学医学部 精神・神経科学教室専任講師の岸本泰士郎氏が研究代表者を務める「PROMPT」プロジェクトでの共同研究の成果をベースにしたものだ。

同社技術でベクトル化したデータによる解析が最も好成績と証明

 同社は2021年4月~2022年3月、慶應義塾大学 医学部 精神・神経科学教室の三村 將 教授を治験調整医師として「会話型 認知症診断支援AIプログラム」のAI医療機器としての実用化に向けた臨床試験を行い、その結果を今回公表した。認知症専門外来を受診した患者と健常者のデータ432症例を対象とし、まず会話データを録音したものを文字に起こして、自然言語処理技術で特徴を抽出、AIに投入できるベクトルデータに変換した。

 データを解析する予測モデルについては「元のベクトルを使用したディープ ニューラル ネットワーク (DNN) によるもの」「元のベクトルを使用したXGBoostアルゴリズムによるもの」「Term Frequency–Inverse Document Frequency (TF-IDF) ベクトルを使用したDNNによるもの」「Bidirectional Encoder Representations from Transformers (BERT) ベクトルを使用した DNNによるもの」と複数用意し、比較検証した。結果、「元のベクトルを使用したディープ ニューラル ネットワーク (DNN) による予測モデル」が最も高い予測精度を達成したことが確認された(精度0.900、感度0.881、特異度0.916)。現在最も広く使われているとされる指標「MMSE」の値(感度0.81、特異度0.89※1)よりも精度が高いことが示されたことになる。

 また文字数と予測精度の関係では、600文字あれば0.8の精度が得られたという。日本語の日常会話は 1 分間に 360 ~ 420 文字と考えられているため、約 100 秒の発話から 600 文字を取得できると計算できることから、発話スピードにも左右されるものの、3−5分間の会話データがあれば十分な精度で判別ができることになる。研究グループではこのことから、実際の診療現場に十分適用できることを示しているとした。同社はこの結果を受け、実用化に向けて薬事承認へのプロセスを進める。

※1 Cognitive Tests to Detect DementiaA Systematic Review and Meta-analysis(JAMA Internal Medicine)

論文リンク:Identifying neurocognitive disorder using vector representation of free conversation(Scientific Reports)