中科院分子影像重点实验室田捷研究员团队,与上海肺科医院史景云主任团队、天津肿瘤医院叶兆祥主任团队,研发了人工智能新算法实现术前无创的预测肺癌EGFR基因突变。该研究发表于呼吸学顶级期刊European Respiratory Journal (SCI IF:12.242,中科院JCR医学一区Top)。论文题目“Predicting EGFR Mutation Status in Lung Adenocarcinoma on CT Image Using Deep Learning”,DOI: 10.1183/13993003.00986-2018。

      肺癌作为发病率第一的癌症,其个性化治疗对于提升患者生存率有重大意义。在肺癌治疗中,基于EGFR基因突变的靶向治疗是主流的治疗方式之一。由于EGFR靶向药物只针对EGFR基因突变的病人有效,因此,使用EGFR靶向药物前需确认病人的EGFR基因突变状态。

      常规的临床诊断需要通过有创的穿刺活检取得肺癌组织,然后进行基因测序来确定EGFR基因突变状态。这种方式面临以下弊端:1)穿刺有创,且基因测序成本高,对测序组织的数量和质量要求高;2)肺癌肿瘤具有很高的异质性,穿刺时只能取得部分组织,若没有穿刺到基因突变组织,则容易造成假阴性的结果,导致病人未得到及时治疗;3)肿瘤基因突变状态会随着时间发生改变,但由于穿刺对病人的伤害较大,难以在不同时间点进行多次穿刺。

      针对以上难题,该团队提出了基于深度学习的人工智能模型,利用术前的CT影像进行无创的EGFR基因突变预测。该方法基于DenseNet思想构建了24层卷积神经网络:首先,将前20层卷积层在ImageNet自然图像数据集上进行预训练,将后4层卷积层使用肺癌CT数据进行全新的训练;然后,对整体网络使用肺癌CT影像进行全局的重新拟合。

      该研究使用上海肺科医院603例肺腺癌病人作为训练集训练人工智能模型,天津肿瘤医院241例肺腺癌病人作为测试集验证模型性能。在独立测试集上,人工智能模型达到了AUC=0.81的预测精度,优于传统的影像组学模型(AUC=0.64)、语义特征模型(AUC=0.64)和临床模型(AUC=0.61)。进一步的特征分析表明,深度学习模型实现了肺癌CT影像的分层特征提取,且卷积层提取的特征在EGFR突变型和EGFR野生型样本间具有显著性差异(图1)。

图1. 深度学习模型特征分析。 a)分层的卷积特征可视化;b)不同特征对于EGFR突变型和EGFR野生型肿瘤的响应不同;c)卷积特征在EGFR突变型和野生型两组病人间存在统计学差异;d)深度学习特征聚类分析。

      在得到较好的预测精度的同时,人工智能模型可标记出肿瘤中EGFR基因突变可疑度较高的区域,指导临床穿刺时穿刺位点的选取(图2)。

                                                                                                                                           

图2. 人工智能模型标记出的EGFR突变高可疑区域

      该研究表明深度学习模型可从肺癌CT影像中挖掘到与EGFR基因突变相关的信息,并达到较好的预测精度;为临床医生提供术前无创的EGFR基因突变预测方法;同时,可发现肿瘤中EGFR基因突变概率高的组织区域,为临床穿刺提供参考。

      本文由中国科学院分子影像重点实验室的王硕博士为第一作者,史景云(上海肺科医院)、叶兆祥(天津肿瘤医院)、董迪(中科院分子影像重点实验室)、喻冬东(中科院分子影像重点实验室)、周牧(斯坦福大学)为并列第一作者,田捷研究员(中科院分子影像重点实验室)为通讯作者。该研究得到了国家自然科学基金、科技部国家重点研发计划、北京市科委重大专项等项目的资助。