钟南山团队携手腾讯研发新冠重症AI预测模型,登上Nature子刊

共 2298字,需浏览 5分钟

 ·

2020-07-28 16:23


钟南山院士团队与腾讯AI Lab一起,共同研发了一个预测COVID-19患者病情发展的AI模型。

这个模型可以分别预测5天、10天和30天内病情危重的概率,能更合理地对病人分别进行诊治。

众所周知,轻度的新冠患者通常是自限性的。

自限性,指疾病在发展到一定程度后,靠着机体调节控制病情发展、并逐渐恢复痊愈。

但并不是所有人都拥有非常强大的抵抗力。

研究显示,6.5%的新冠患者可能会突然发展为重症患者。

这些忽然转化为重症的患者不仅需要大量的医护资源,而且死亡率高达49%

因此,尽早识别有重症风险的患者,及早进行病情干预,对于预测病情发展、以及医疗资源高效分配至关重要。

而这个模型,是基于AI对大数据的分析实现的。

基于深度学习的患者数据分析

事实上,准确预测重症患者的风险并非易事。

研究发现,临床上与重症患者相关的特征多达74个,如果要采用传统方法建立预测模型,恐怕难以实现。

经过考量后,团队决定采用深度学习,对大数据进行分析。

之所以采用深度学习,是因为它可以通过神经网络,对特征进行高阶非线性组合,从而更深层次地建立特征与目标函数之间的映射。

为了更精确地建模这10项特征与重症风险的关系,团队采用了结合Cox生存分析算法与LASSO算法的方式,来挖掘数据之中的隐含联系,进而计算病人的重症风险系数。

数据表明,研究团队一共对来自全国575家医院的1590名患者的数据进行了建模。

最终,经过分析,团队确定了10项能很好预测重症风险的患者特征:

10项特征包括:年龄、是否气促、是否有恶性肿瘤病史、是否有慢性肺阻、合并症数量、是否有 X 光平片异常、血液中性粒细胞与淋巴细胞比例、血液乳酸脱氢酶含量、血液直接胆红素含量、血液肌酸激酶含量。

这10项特征都可以通过正常检测途径获得,可用于预测重症病情的风险。

从这10项特征的单因素进行分析,可以发现,年龄是新冠肺炎发展至重症最大的风险之一。

事实上,超过60岁的新冠患者,病情发展成重症的概率明显更高。(老人更要保护好自己)

直观了解风险系数

研究团队在训练好的模型基础上,增加了一层线性Cox模型,便于产生可供医生解读的最终结果。

这层线性模型会按重要性,分别对深度学习模型的预测值与10项特征的值赋予不同的权重,并通过求和,得到最终风险系数。

模型可以通过诺模图手动进行计算。

诺模图,在临床上经常被用来综合各项数值换算最终评估分数。

通过诺模图,医生可以很直观地了解各项观察值与风险系数之间的关系,同时也可以在没有电脑的情况下手动计算风险系数。

上图是基于训练好的模型,对一位新冠肺炎患者的身体数据进行分析后,所得到的诺模图。

可以看见,这名患者的总体诺模图分数为 209,未来 5、10、30 天的总体重症概率分别为 0.58、0.62、0.69,因此被归类为有较高的重症风险。

更好的预测效果

实验证明,这个AI模型相比于此前的经典Cox模型,具有更高的预测准确性。

经过训练,模型在测试集上的准确性(C-index)从0.876提升到了0.894,AUC(用于衡量检测方法真实性)从 0.889 提升到了 0.911。

不仅如此,采用这种模型对另外1393个外部检验患者的数据进行分析后,发现预测的效果非常好。

在这1393个患者中,共有106个患者发展成重症,只有2例数据异常的患者被错误地划分到了低风险组。

除此之外,研究团队还对不同地理区域、卫生资源的三组数据进行了测试,包括武汉940例、湖北省武汉市以外的地区380例,以及广东73例,准确性分别为0.878、0.769和0.967。

排除10个临床特征参数缺失超过3个以上的患者后,准确性上升为0.890、0.852和0.967,表明这项模型具有很好的普适性。

除此之外,这个AI预测模型还有更多优势,例如可以自动填补缺失的数据,以及可以随着应用数据的增加而不断进化,令准确性再一步提高。

研究于2020年7月15日发表在国际顶级期刊「Nature」的子刊「Nature Communications」上,目前已开源。(项目链接见文末)

感兴趣的小伙伴们,可以戳下方传送门查看项目代码~

作者介绍

一作有两位,分别是梁文华博士与姚建华博士。

梁文华博士,来自广州医科大学附属第一医院,专业方向为肺癌及肺部结节的综合诊治,尤其基因检测、靶向治疗及免疫治疗、术后跟踪等。

姚建华博士来自腾讯AI Lab,目前在医疗中心就任首席科学家。

与此同时,钟南山院士、广州呼吸健康研究院院长何建行、腾讯AI Lab医疗中心负责人黄俊洲也为共同作者。

传送门

项目链接:
https://github.com/cojocchen/covid19_critically_ill

网站链接:

https://aihealthcare.tencent.com/COVID19-Triage_en.html

往期推荐 本周优秀开源项目分享,人员检测和跟踪、OCR工具库、汉字字符特征提取工具 等8大开源项目干货 |分享17个机器学习的常用算法!机器学习必读TOP 100论文清单:高引用、分类全、覆盖面广丨GitHub 21.4k星23个Python爬虫开源项目代码:爬取微信、淘宝、豆瓣、知乎、微博等
浏览 25
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报