/2019.05.08
CheXpert
年初,斯坦福大学吴恩达团队发布了CheXpert大型数据集,这个数据集内含224,316张标注好的胸部X光片以及放射科医师为每张胸片写的病理报告,共涉及65,240名患者。数据集的时间跨度为2002年10月到2017年7月,都是患者在斯坦福医院进行胸部X光检查之后的留存,除此之外,该数据集还附有相关的放射学报告,其数据量级和标注精准度非常高,斯坦福希望该数据集能够帮助开发和验证胸部X光片解释模型,以改善全球医疗服务的获取和交付。
吴恩达带领团队用这个数据集做Benchmark,举行了一场关于肺不张 (Atelectasis)、心脏肥大 (Cardiomegaly)、肺实变 (Consolidation)、肺水肿 (Edema)、胸腔积液 (Pleural Effusion)等5种疾病的识别比赛,此次比赛以具有不确定性标签和放射科医师标记的参考标准评估集为特色,翼展的人工智能模型在这场比赛中排名第二。
据了解,此次比赛的评判标准为AUC(Area under the Curve of ROC)。AUC是衡量二分类模型优劣的一种评价指标,表示正例排在负例前面的概率,它能很好地描述模型整体性能的高低。翼展模型的AUC评分为0.917,仅低于第一名0.001,吴恩达团队的基线模型以AUC0.907的排在榜单第六。
“在现有开源模型的基础上,我们进行了数据增强及整体深度学习,另外,在编写代码的时候,我们非常注意合理应用数据集,我想这就是我们的模型能超越吴老师团队基线模型原因。”提到得意之作,翼展研发组工程师任远志满脸自豪。“我们的模型能够预测竞赛标注的5种疾病并直接标注疾病类型。接下来,我们将在自有数据集上进行模型的验证和完善,同时工程团队还将对模型进行压缩,以期能够应用于生产环境。”
作为全球范围内最常见的影像检查,胸部X光造影对很多致命疾病的筛查、诊断和控制都具有重要作用,可达临床影像专家水平的自动化胸片标注及解读在很多医疗情景下具有巨大价值,比如提高医疗人员工作效率 、大型筛查的临床决定以及全球化人口健康的创建。此次比赛对行业发展的推动作用毋庸置疑。
翼展基于云影平台,推出人工智能开放协作平台,并持续完善平台功能,力求深度服务影像科的工作流程并帮助影像科医生提高工作效率。去年,翼展发布了多病种的DR胸肺自动报告系统—— W-insight DR AI Reporting,该系统通过业界领先的机器学习技术,实现DR图像自动生成诊断报告。据了解,翼展团队收集了近两百家医院的数据,整理出近十万份高质量的图像和对应的报告内容,经过两年多的时间才推出了W-insight产品,目前,基于DR的胸部图像可自动生成针对17种病灶的报告内容。
未来,翼展团队将继续深入研发,通过AI技术赋能医疗产业,释放供给侧能力,在医疗产业发展道路上继续砥砺前行。
北京市朝阳区朝外SOHO A座1101室
Tel:400-622-6835
西安市长安区航天中路385号 众创广场5.6层
Tel:029-8832 8071
Fax:029-8832 8073