中科院分子影像重点实验室与复旦大学附属中山医院周平红主任团队开展了医工交叉合作,针对早期胃癌人工诊断准确率不足的临床问题,利用深度学习方法自动挖掘和分析了胃部窄带成像放大内窥镜图像的特征,实现了早期胃癌的智能诊断,研究结果于近期发表在胃肠肝病学临床权威期刊Gastrointestinal EndoscopySCI IF6.89,中科院医学一区TOP,题目为“Identifying early gastric cancer under magnifying narrow-band images with deep learning: a multicenter study”(DOI: 10.1016/j.gie.2020.11.014)。

胃癌是全球最常见的恶性消化道肿瘤之一,每年约有100万新发病例。晚期胃癌的生存预后较差,而早期胃癌的5年生存率可以超过90%,因此及时、准确的诊断对于提高胃癌患者的生存期非常必要。窄带成像放大内窥镜(ME-NBI)是诊断早期胃癌最有效的工具之一。但在临床实践中,基于ME-NBI的早期胃癌人工诊断严重依赖临床内镜医师的专业知识和经验,内镜医师间的诊断结果差异很大,总体敏感性为60%-100%,特异性为84%-100%。因此,临床上亟需开发自动、精准的早期胃癌诊断工具。

针对上述临床需求,中科院分子影像重点实验室基于多中心回顾性早期胃癌数据,采用深度学习方法构建并验证了针对早期胃癌的智能诊断模型,提高了对早期胃癌的诊断准确率。具体而言,该研究从复旦大学附属中山医院回顾性收集了243例早期胃癌患者的1591张胃部ME-NBI图像,随机将其中70%患者的图像作为训练集(TC),将剩余30%患者的图像作为内部测试集(ITC)。该研究以在公开数据集ILSVRC-2012上预训练的VGG-19神经网络为基础,将其最顶层替换为二分类全连接层,并在TC上不断迭代训练对网络参数进行微调,通过早停方法确定最终的早期胃癌智能诊断模型。在ITC上验证模型的鲁棒性,同时采用基于梯度权重的类别激活图(Grad-CAM)分析模型的可解释性。此外,该研究还从上海市儿童医院、武汉市中心医院收集52例早期胃癌患者的ME-NBI图像构成外部测试集(ETC),对模型的泛化性进行验证。为了进一步评估模型的诊断性能和对临床的价值,将模型诊断结果分别与三位初级和五位高级内镜医师的诊断结果进行比较。

结果表明,构建的智能诊断模型能很好地识别早期胃癌,在TC和ITC上的受试者工作特性曲线下面积(AUC)分别为0.914(95% CI: 0.897-0.930)和0.808(95% CI: 0.769-0.846),达到了与高级内镜医师相当的水平(准确率(ACC):0.770 vs 0.755,P=0.355;敏感性(SE):0.792 vs 0.767,P=0.183;特异性(SP):0.745 vs 0.742,P=0.931),且其泛化性在外部数据集上得到了验证(AUC:0.813 (95% CI: 0.751-0.876),ACC:0.763)。同时,根据智能诊断模型的提示,八位内镜医师的平均诊断精度得到了显著性提高(P<0.05),这表明模型具有较好的辅助诊断价值。

图1. (a) 智能诊断模型在ITC和ETC中的受试者工作特性曲线(ROC)。(a)智能诊断模型和内镜医师在ITC中的ROC曲线。(b)智能诊断模型在ETC中的ROC曲线。

 

图2. 智能诊断模型的类别激活图示例。红色区域是模型发现的异常区域,白色箭头和白色虚线表示实际异常区域的边界。

 

图3. 智能诊断模型与内镜医师的比较结果。a) 智能诊断模型提示前、后的内镜医师整体诊断结果。b) 智能诊断模型提示前、后的高级和初级内镜医师的诊断结果。EGCM:智能诊断模型,PPV:阳性预测值,NPV:阴性预测值,*:显著性差异。

 

本文由复旦大学附属中山医院胡皓医生作为第一作者,东北大学访问博士生巩立鑫和董迪副研究员(分子影像重点实验室)作为并列第一作者,周平红教授(复旦大学附属中山医院)和田捷研究员(分子影像重点实验室/北航-首医大数据精准医疗高精尖创新中心)为并列通讯作者。该研究得到了国家自然科学基金委、科技部、北京市科委、中国科学院等项目的资助。

全文链接:http://doi.org/10.1016/j.gie.2020.11.014