鐘南山團(tuán)隊攜手騰訊研發(fā)新冠重癥AI預(yù)測,成果登上Nature子刊
鐘南山院士團(tuán)隊與騰訊AILab日前披露了利用AI預(yù)測COVID-19患者病情發(fā)展至危重概率的研究成果,可分別預(yù)測5天、10天和30天內(nèi)病情危重的概率,有助合理地為病人進(jìn)行早期分診。這項研究已在2020年7月15日發(fā)布于國際頂級期刊Nature子刊Nature Communications。
這項名為《深度學(xué)習(xí)在新冠肺炎危重患者早期分診中的應(yīng)用》的研究,是鐘南山院士團(tuán)隊與騰訊公司共同成立的大數(shù)據(jù)及人工智能聯(lián)合實驗室的成果之一,第一作者分別是廣州呼吸健康研究院院長助理梁文華博士,以及騰訊AI Lab醫(yī)療中心首席科學(xué)家姚建華博士、鐘南山院士、廣州呼吸健康研究院院長何建行、騰訊AI Lab醫(yī)療中心負(fù)責(zé)人黃俊洲均為共同作者。
大數(shù)據(jù)及人工智能聯(lián)合實驗室副主任、騰訊醫(yī)療副總裁吳文達(dá)醫(yī)生指出,當(dāng)前新冠肺炎疫情在全球持續(xù)蔓延,高效抗疫、降低患者死亡風(fēng)險,仍是取得抗疫勝利的關(guān)鍵,希望大數(shù)據(jù)、人工智能等新技術(shù),以及騰訊海量的用戶觸達(dá)能力,騰訊云安全、快速部署的能力,能夠在抗疫常態(tài)化中發(fā)揮作用,更有效地防控流行病疫情。
此項研究基于人工智能深度學(xué)習(xí)所建立的生存模型,對COVID-19患者入院時的10項臨床特征進(jìn)行分析,可以幫助預(yù)測患者發(fā)展至危重病情的風(fēng)險,如在患者住院期間持續(xù)采用此模型進(jìn)行分析,預(yù)測結(jié)果會更加準(zhǔn)確,有助于監(jiān)測患者住院期間的風(fēng)險趨勢。依據(jù)此模型開發(fā)出的預(yù)測工具“COVID-19患者重癥早期分診系統(tǒng)”已經(jīng)在線公開于https://aihealthcare.tencent.com/COVID19-Triage_en.html,臨床醫(yī)護(hù)工作人員也可以訪問微信小程序獲得這一工具。
醫(yī)護(hù)人員只需輸入患者的臨床特征,重癥早期分診系統(tǒng)就可以返回患者在5、10和30天內(nèi)病情發(fā)展至危重的概率,進(jìn)而對患者進(jìn)行早期分診,對于COVID-19疾病的管理具有極高的臨床和經(jīng)濟(jì)價值。
同時,這項研究成果也通過Github向全球開源,以支持全球抗擊新冠疫情,Github開源項目查詢鏈接為https://github.com/cojocchen/covid19_critically_ill
臨床研究顯示,輕度的COVID-19患者通常是自限性的,即疾病在發(fā)生發(fā)展到一定程度后,靠機(jī)體調(diào)節(jié)能夠控制病情發(fā)展并逐漸恢復(fù)痊愈。但6.5%的患者有突然進(jìn)展為嚴(yán)重疾病的趨勢,這些重癥病例不但需要大量的醫(yī)療護(hù)理資源,其死亡率也高達(dá)49%。因此患者突然惡化為重癥是抗疫工作中主要關(guān)注的問題,盡早識別有重病風(fēng)險的患者并早期進(jìn)行干預(yù),對于患者預(yù)后的改善至關(guān)重要。同時早期識別不同風(fēng)險的患者進(jìn)行有效分類,也有利于醫(yī)療資源的高效合理分配,確保最有重癥風(fēng)險的患者盡快得到最合適的醫(yī)療及護(hù)理,這種能力在疫情大規(guī)模爆發(fā)時更是至關(guān)重要。
然而,準(zhǔn)確預(yù)測患者進(jìn)展至重癥的風(fēng)險并非易事。研究團(tuán)隊發(fā)現(xiàn),臨床中與此相關(guān)的患者特征多達(dá)74個,這使采用傳統(tǒng)方法建立準(zhǔn)確的預(yù)測模型難以實現(xiàn)。但大數(shù)據(jù)與人工智能的發(fā)展將不可能變?yōu)榭赡?,大?shù)據(jù)及人工智能聯(lián)合實驗室團(tuán)隊以騰訊AILab技術(shù)為核心,通過機(jī)器學(xué)習(xí)選擇變量算法,確定了10個患者特征指標(biāo),包括X線影像異常、年齡、呼吸困難、慢性阻塞性肺病、合并癥數(shù)量、癌癥病史、中性粒細(xì)胞/淋巴細(xì)胞比、乳酸脫氫酶、直接膽紅素和肌酸激酶,以來自575個醫(yī)療中心的1590名COVID-19患者病例進(jìn)行模型訓(xùn)練,進(jìn)而開發(fā)出深度學(xué)習(xí)生存Cox模型。這個模型可以根據(jù)COVID-19患者入院時的臨床特征,預(yù)測病情發(fā)展至危重病的風(fēng)險。
Cox模型基于深度學(xué)習(xí)方法,相比傳統(tǒng)經(jīng)典方法,深度學(xué)習(xí)的優(yōu)勢是可通過神經(jīng)網(wǎng)絡(luò)對特征進(jìn)行高階非線性組合,從而更深層次地建立特征與目標(biāo)函數(shù)之間的映射。經(jīng)過訓(xùn)練,所設(shè)計的模型在驗證集上的 C-index (即一致性指數(shù)(index of concordance),通過評估模型預(yù)測結(jié)果與實際觀察結(jié)果的符合程度,以評價模型的預(yù)測準(zhǔn)確性,值越接近1,準(zhǔn)確率越高)從0.876(線性模型)提升到了 0.894,AUC(指受試者工作特征曲線下面積,值在1.0和0.5之間,在AUC>0.5的情況下,AUC越接近于1,說明診斷效果越好)從 0.889 提升到了 0.911。
為測試模型的普適性,研究團(tuán)隊還對不同地理區(qū)域和不同衛(wèi)生資源水平的三個獨(dú)立隊列進(jìn)行了模型測試,三個患者隊列涵蓋武漢940例、湖北省武漢市以外地區(qū)380例,以及疫情期間未出現(xiàn)健康資源枯竭的廣東73例,外部測試病例均與模型訓(xùn)練病例范圍不重疊。三個獨(dú)立隊列測試中,C指數(shù)展現(xiàn)的重癥模型預(yù)測與實際發(fā)生一致性分別為0.878、0.769和0.967,排除10個臨床特征參數(shù)缺失超過3個以上患者后的隊列測試模型預(yù)測與實際發(fā)生一致性分別為0.890、0.852和0.967,顯示深度學(xué)習(xí)生存Cox模型的準(zhǔn)確預(yù)測具有普適性。

一項技術(shù)只有得到實際應(yīng)用才能發(fā)揮出真正的價值。研究團(tuán)隊在深度Cox模型的基礎(chǔ)上又加了一層線性Cox模型,以便產(chǎn)生可供醫(yī)生解讀的最終結(jié)果。該線性模型會按重要性分別對深度學(xué)習(xí)模型的預(yù)測值與10項特征的值賦予不同的權(quán)重,然后通過求和得到最終風(fēng)險系數(shù)。該線性模型可以通過諾模圖進(jìn)行手動計算,因其便利性在臨床上經(jīng)常被用來綜合各項數(shù)值換算最終評估分?jǐn)?shù)。通過諾模圖,醫(yī)生可以很直觀地了解各項觀察值與風(fēng)險系數(shù)之間的關(guān)系,同時也可以在沒有電腦的情況下手動計算風(fēng)險系數(shù)。
此外,這個AI預(yù)測系統(tǒng)較傳統(tǒng)預(yù)測模型還有其他的優(yōu)勢,包括應(yīng)用當(dāng)中自動填補(bǔ)缺失數(shù)據(jù)而進(jìn)行預(yù)測,以應(yīng)對不同地區(qū)和醫(yī)院的實際情況,以及可以隨著應(yīng)用數(shù)據(jù)的增加而不斷進(jìn)化,準(zhǔn)確性可以進(jìn)一步提高。
今年2月27日,鐘南山院士團(tuán)隊與騰訊公司宣布達(dá)成合作,共同成立大數(shù)據(jù)及人工智能聯(lián)合實驗室,攜手持續(xù)抗擊新冠肺炎疫情,將以大數(shù)據(jù)及人工智能攻堅流行病、呼吸疾病和胸部疾病的篩查和防控預(yù)警。
來源:騰訊科學(xué)WE大會