通過機器學習,聯(lián)合言語數(shù)字標志物和體液標志物可預測認知障礙
Speech digital biomarker combined with fluid biomarkers predict cognitive impairment through machine learning
【亮點】:
由王剛教授團隊在《Alzheimers Research & Therapy》(IF=7.6)上發(fā)表語音數(shù)字生物標志物與血液生物標志物預測認知損傷與大腦病理變化的研究,并成功構建了高效、低成本的機器學習診斷模型。
1、基于宇測超靈敏單分子免疫檢測技術;
2、首次在大規(guī)模人群中驗證了語音沉默時間占比(PSD)與阿爾茨海默病核心血液生物標志物(GFAP、NfL、p-Tau217)及腦內(nèi)Aβ沉積具有相關性;
3、認知損傷診斷模型:結合年齡、性別、教育年限、APOE基因型、PSD和血清GFAP,模型診斷認知損傷的AUC達0.928;
4、Aβ狀態(tài)預測模型:結合PSD、APOE、P-tau217和人口學信息,模型預測PET Aβ 陽性狀態(tài)的AUC達0.845
5、提出“語音+血液生物標志物”的整合篩查策略,兼顧可及性、成本效益與準確性,有望推動AD早期篩查在基層醫(yī)療中的應用。
【摘要】:
背景:
目前阿爾茨海默?。ˋlzheimer’s disease,AD)早期檢測的方法受限于高成本、侵入性強以及可及性不足,這凸顯了迫切需要一種可獲得、可負擔且對患者友好的替代途徑。既往研究表明,語音分析是認知障礙(cognitive impairment,CI)早期診斷的有前景工具。然而,語音測試與潛在病理變化之間的相關性仍未確定,甚至尚不清晰,其臨床應用價值也缺乏病理學驗證。因此,需要通過大樣本分析進一步探討二者之間的關系,并建立能夠診斷認知障礙的模型。
方法:
本研究共納入1223名受試者,包括可能的AD或AD患者(n=238)、遺忘型輕度認知障礙(amnestic mild cognitive impairment,aMCI)患者(n=461)以及認知正常者(cognitively unimpaired,CU)(n=524)。所有參與者均接受了神經(jīng)心理學測試、“偷餅干”任務的語音錄制、血清生物標志物定量檢測和APOE基因分型,其中部分受試者還接受了Aβ PET成像。采用偏相關分析(Partial Correlation Analysis)和局部加權回歸(LOWESS)探討語音數(shù)字生物標志物與其他核心AD生物標志物之間的相關性。最后,利用機器學習方法(如XGBoost和邏輯回歸)構建了認知障礙及Aβ狀態(tài)的高性價比預測模型,并通過SHAP值進行特征重要性篩選。
結果:
不同組別之間的AD生物標志物存在顯著差異。值得注意的是,語音數(shù)字生物標志物中的靜默持續(xù)時間百分比(percentage of silence duration,PSD)與認知水平、血清膠質(zhì)纖維酸性蛋白(glial fibrillary acidic protein,GFAP)、神經(jīng)絲輕鏈蛋白(neurofilament light chain,NFL)、磷酸化Tau蛋白217位點(p-Tau217)以及特定腦區(qū)的淀粉樣蛋白沉積呈相關關系。此外,研究發(fā)現(xiàn)隨著Aβ沉積不同階段的進展,PSD、p-Tau217和GFAP表現(xiàn)出雙階段變化模式?;谏鲜鼋Y果,構建了一個包含PSD、APOE、GFAP及人口學信息的認知障礙機器學習診斷模型(AUC=0.928,95% CI 0.897–0.960)。同時,還建立了一個結合PSD、APOE、p-Tau217及人口學數(shù)據(jù)的Aβ狀態(tài)分類模型(AUC=0.845,95% CI 0.783–0.907)。
結論:
將語音數(shù)字標志物與血清及其他生物標志物相結合,有助于識別認知障礙,代表了AD檢測領域的一個有前景的進展。本研究為語音數(shù)字生物標志物在AD診斷中的應用提供了初步且令人鼓舞的證據(jù)。