隨著醫(yī)療信息化的發(fā)展,基于醫(yī)療時序數據持續(xù)地進行疾病診斷和預后,可以有助于避免時間敏感性疾病和突發(fā)性傳染疾病的惡化,保證患者及時救治,合理分配緊缺醫(yī)療資源。然而在醫(yī)療場景中,生命體征的復雜性和動態(tài)演化性限制了現有深度學習技術在持續(xù)診斷上的精度。另外,如何將深度學習模型難以顯式表達的學習過程匹配到疾病特征和機制上,幫助醫(yī)生更好地理解人工智能技術的決策過程,仍有待探索。
近日,研究院洪申達助理教授和北京大學智能學院李紅燕教授團隊,在Cell Press細胞出版社旗下Patterns期刊發(fā)表了題為“Continuous Diagnosis and Prognosis by Controlling the Update Process of Deep Neural Networks”的文章,首次提出了時序數據的持續(xù)分類概念,并設計了一種深度神經網絡的限制性更新策略,緩解了深度學習模型在建模多種數據分布時的災難性遺忘和過擬合問題,在多個真實醫(yī)療時序數據集上表現出優(yōu)越的持續(xù)診斷和預后性能,為挖掘疾病特性、典型階段、生物標志物提供了新思路。本研究發(fā)現:
1. 持續(xù)分類模式在診斷和預后方面比單次分類模式更有潛力。通過在膿毒癥的持續(xù)診斷、新冠肺炎的持續(xù)死亡預測、重癥監(jiān)護病房的持續(xù)疾病識別這三種醫(yī)療分類任務上開展的實驗表明,具有持續(xù)分類模式的RU明顯優(yōu)于僅有單次分類模式的方法以及其它可進行持續(xù)分類的方法,平均精度分別達到90%、97%、85%,效果最好。
2. 限制深度學習模型的更新過程可避免災難性遺忘和過擬合問題。RU為不同時期的時序數據設定不同的模型更新參數以及參數的更新程度,使得因時序數據動態(tài)演化而形成的多種數據分布的分類映射在模型表示空間中不會相互沖突。在此策略下,上述三種醫(yī)療持續(xù)分類任務的平均精度均可提升至少7%。
3. 對持續(xù)預后的解釋可揭示疾病發(fā)展階段和生物標志物。通過可視化模型參數的限制更新過程,發(fā)現了膿毒癥的4個階段和生物標志物(心率、呼吸、動脈壓、PaCO2、血小板計數、總膽紅素、肌酐)、新冠肺炎的3個階段和生物標志物(淋巴細胞、乳酸脫氫酶、超敏C反應蛋白、間接膽紅素、肌酐)。不同的疾病發(fā)展階段具有不同的死亡風險和標志物水平、體現出某些疾病特性,如特定的生命體征變化可反映急性膿毒癥的發(fā)生,具有某些先天特征更易患膿毒癥等。
4. 深度神經網絡限制性更新策略RU可泛化并適用于其它場景。RU使已訓練模型在新數據(不同性別的患者數據、不同年齡的患者數據、不同分布的數據)上的精度下降平均小于2%,并且與模型類型和具體分類任務解耦合,可作為深度學習模型的即插即用模塊應用在其它場景的CCTS任務中。本研究測試了RU在氣象預測、動作識別、以及多種模擬數據、信號、傳感等時序數據上的表現,精度均優(yōu)于基線方法。

文章鏈接:https://www.cell.com/patterns/fulltext/S2666-3899(23)00018-1
通訊作者介紹
李紅燕 教授
李紅燕,北京大學智能學院教授,中國計算機學會數據庫專委會委員、中國通信學會云計算與SaaS專委會委員、人民網人工智能研究院專家委員會首批特聘專家。長期從事數據管理、分析與挖掘和機器學習方向的科研教學工作。發(fā)表學術論文百余篇,出版學術專著、教材和譯著多部。主持并完成國防科技創(chuàng)新特區(qū)項目以及多項國家自然科學基金項目。相關研究成果在軍事、航空、航天、醫(yī)療、移動通訊等領域有實際應用。曾獲2022年度ICT產業(yè)木蘭獎,Institute of Physics(IOP)Publishing的2021中國高被引論文獎。

洪申達 助理教授
洪申達,北京大學健康醫(yī)療大數據國家研究院助理教授、副研究員、博士生導師,研究方向為電子病歷、生理信號等醫(yī)療時序數據的人工智能算法研究及臨床應用。目前主持國家自然科學基金青年科學基金項目1項,發(fā)表學術論文50余篇。擔任SPJ Health Data Science期刊Associate Editor,擔任KDD、ICLR、ICML、NeurIPS、The Lancet Digital Health、NPJ Digital Medicine等國際會議和期刊的PC Member或審稿人。曾獲得PhysioNet Challenge 2017 First Place、第五屆中國"互聯網+"大學生創(chuàng)新創(chuàng)業(yè)大賽全國金獎等,相關產品已取得醫(yī)療器械注冊證。
