近日,谷歌在《美国医学会杂志》发表题为 “Development and Validation of a Deep Learning Algorithm for Detection of Diabetic RetinoPathy in Retinal Fundus Photographs”的论文,正是谷歌研究人员提出的一种基于深度学习的算法,该算法能够在视网膜造影中对糖尿病视网膜病变的迹象做出解释,帮助医生克服资源短缺资困难,为更多的病人做出更专业的诊断。
论文:用于检测视网膜眼底照片中糖尿病性视网膜病变的深度学习算法的开发和验证
《Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs》
摘要:
重要性:深度学习是指能让算法通过学习能展现出预期行为的大量样本以进行自我编程的一系列方法,这让我们可以不再需要特定一些明确的规则。这些方法在医学成像上的应用还需要进一步的评估和验证。
目标:为了应用深度学习来创建一种能通过视网膜眼底照片自动检测糖尿病性视网膜病和糖尿病性黄斑水肿的算法。
设计和配置:我们使用了一种被称为深度卷积神经网络的专为图像分类而优化过的神经网络模型,该网络使用 128175 张视网膜图像的数据集进行了训练,其中的每一张图像都针对糖尿病性视网膜病变、糖尿病性黄斑水肿和图像等级进行了 3 到 7 次评估。所得到的算法使用 2016 年 1 月和 2 月的两个互相独立的数据集进行了验证,其中的每张图像测试所参考的标准是一个 7 或 8 人的美国认证眼科医生中大多数人的意见。
主要结果和措施:这种用于检测可发病的糖尿病性视网膜病(RDR/referable diabetic retinopathy,即中度和更糟糕的糖尿病性视网膜病)、可发病的糖尿病性黄斑水肿或同时两者的算法的灵敏度(sensitivity)和特异性(specificity)是基于眼科专家小组中大多数决策的参考标准。该算法在为两个开发集所选择的 2 个操作点上进行了评估,其中一个是为高特异性选择的,另一个则是为高灵敏度选择的。
**结果:**EyePACS-1 数据集包含了来自 4997 位病人(平均年龄 54.4 岁)的 9963 张图像;其中 62.2% 的女性;普遍是 RDR,683/8878 完全可分级的图像(占 7.8%)。Messidor-2 数据集有来自 874 位病人(平均年龄 57.6 岁)的 1748 ;42.6% 女性;普遍是 RDR,254/1745完全可分级的图像(占 14.6%)。为了检测 RDR,该算法在 EyePACS-1 上的受试者操作曲线( ROC 曲线)下的面积为 0.991(95% CI, 0.988-0.993),在 Messidor-2 上的 ROC 曲线下的面积为 0.990 (95% CI, 0.986-0.995)。使用第一个高特异性的操作切入点(operating cut point),对于 EyePACS-1 ,灵敏度为 90.3% (95% CI, 87.5%-92.7%)、特异性为 98.1% (95% CI, 97.8%-98.5%)。对于 Messidor-2,灵敏度为 87.0% (95% CI, 81.1%-91.0%)、特异性为 98.5% (95% CI, 97.7%-99.1%)。使用开发集第二个高灵敏度的操作点,对于 EyePACS-1,灵敏度为 97.5% 而特异性为 93.4%;对于 Messidor-2,灵敏度为 96.1% 而特异性为 93.9%。
结论与相关:在这项成人的糖尿病性视网膜眼底照片的评估中,基于深机器学习的算法对可疑糖尿病性视网膜病变检测时具有高灵敏度和特异性。 这将确认此算法应用在临床中的可行性,并确定与目前的眼科评估相比是否使用该算法可以改善治疗和诊断结果。
检测糖尿病性眼病的一种最常见的方法是让专科医生来检查眼后部的图像(图 1),然后再评估疾病是否存在及其严重程度。其中疾病的严重程度是由病变(如微动脉瘤、出血、硬渗出物等)的类型所确定的,这些症状表明了眼部之中的出血和液体渗出情况。然而解读这些照片需要经过专门的训练,而在世界上许多地区,还没有足够多合格的评估者能够筛选出存在发病风险的每个人。
图 1:为了筛选 DR 而拍摄的视网膜眼底照片样本。左侧的图像是健康的视网膜(A),而右边的图像则是可引起糖尿病性视网膜病变的视网膜(B),可以看到存在出血状况(红点)。
论文下载:http://jamanetwork.com/journals/jama/fullarticle/2588763