話し言葉の音声を機械学習、アルツハイマー病検出の可能性示す 新潟医療福祉大学

 アルツハイマー病(AD)を含む認知症のスクリーニング、診断支援についての新たな提案を日本の研究グループが発表した。健常の高齢者と患者の話し言葉を音声スペクトル解析で比較した結果、アルツハイマー病患者の発話特徴を発見したという。

オープンソースの音声分析ツールで検証

 成果を発表したのは、新潟医療福祉大学言語聴覚学科の田村俊暁講師と作業療法学科の能登真一教授。先行研究でアルツハイマー病(AD)患者の発話や言語における変化が報告されているが、現時点では臨床応用ができるほどの定量的な特徴の抽出、エビデンス確立には至っていない。研究グループでは、機械学習を用いてこれらの不規則性を特徴付けることで、ADの早期非侵襲的診断に貢献する可能性があるとみて検証を試みた。

 具体的には、健常高齢者(Healthy Elderly)75名とAD患者(Patients83名の音声特徴の違いを、現在診断指標として広く活用されているMMSEHDS-Rの全回答、および質問前後の自由会話から計算、検討した。国際的に広く使用されているオープンソースの音声分析ツールであるopenSMILEやPraatを活用し、それぞれの群の音声の基本周波数、その強度とスペクトルの特徴を抽出、比較検討したところ、AD患者は緩やかな下降勾配を示すのに対し、健常者は6,000Hz付近で急激な下降勾配を示す傾向があることを確認したという。

 そこで研究グループはさらに、その平均値、中央値、最小値、最大値、15パーセンタイル、85パーセンタイル、標準偏差、歪度、尖度のそれぞれの特徴量を調べた。結果、スペクトルは、すべての成分で両群間に有意差が認められ、強度については、標準偏差を除くすべての成分で両群間に有意差が確認されたとしている。

 また研究グループは、機械学習で使われるアルゴリズム構築手法であるロジスティック回帰(LR)、サポートベクターマシン(SVM)、ランダムフォレスト(RF)を元にした分類器をそれぞれ開発。性能評価を行ったところ、スペクトル尖度の標準偏差の分類において、全ての分類器でAUC0.95以上の高い判別能を示し、特にLRとSVMはAUC0.97以上だったという。

 研究グループでは今回の成果について、実用化に向けては追加の研究が必要だが、将来AIを使った初期診断の可能性を示したものだとしている。

論文リンク:Analysis of Speech Features in Alzheimer’s Disease with Machine Learning: A Case-Control Study  –  Healthcare(Basel)