简介:摘要目的研制基于深度卷积神经网络的放大蓝激光成像(ME-BLI)和放大窄带成像(ME-NBI)模式下早期胃癌识别系统,比较2种模式下模型的性能差异,并探讨模型训练方式对准确度的影响。方法回顾性收集ME-BLI和ME-NBI下的胃良性病灶和早期胃癌的内镜图像,共收集5个数据集和3个测试集:数据集1包括2 024张非癌和452张早期胃癌ME-BLI图片,数据集2包括2 024张非癌和452张早期胃癌ME-NBI图片,数据集3是数据集1和2的合集(共4 048张非癌、904张早期胃癌ME-BLI和ME-NBI图片),数据集4在数据集2的基础上增加62张非癌和2 305张早期胃癌ME-NBI图片(共2 086张非癌和2 757张早期胃癌ME-NBI图片),数据集5在数据集3的基础上增加62张非癌和2 305张早期胃癌ME-NBI图片(共4 110张非癌、3 209张早期胃癌ME-BLI和ME-NBI图片);测试集A包括422张非癌和197张早期胃癌ME-BLI图片,测试集B包括422张非癌和197张早期胃癌ME-NBI图片,测试集C是测试集A和测试集B的合集(共844张非癌、394张早期胃癌ME-BLI和ME-NBI图片)。根据5个数据集分别构建5个模型,分别评估其在3个测试集中的表现。通过以病灶为单位的视频测试,比较ME-NBI和ME-BLI模式下早期胃癌识别模型在临床环境下的性能差异,并与4名资深内镜医师进行比较。主要终点指标为早期胃癌的诊断准确度、灵敏度和特异度。采用卡方检验进行统计学分析。结果模型1在测试集A的表现最佳,准确度、灵敏度、特异度分别为76.90%(476/619)、63.96%(126/197)、82.94%(350/422);模型2在测试集B的表现最佳,准确度、灵敏度和特异度分别为86.75%(537/619)、92.89%(183/197)、83.89%(354/422);模型3在测试集B中的表现最佳,准确度、灵敏度和特异度分别为86.91%(538/619)、84.26%(166/197)、88.15%(372/422);模型4在测试集B的表现最佳,准确度、灵敏度和特异度分别为85.46%(529/619)、95.43%(188/197)、80.81%(341/422);模型5在测试集B的表现最佳,准确度、灵敏度和特异度分别为83.52%(517/619)、96.95%(191/197)、77.25%(326/422)。根据图片识别早期胃癌,模型2~5的准确度均高于模型1,差异均有统计学意义(χ2=147.90、149.67、134.20、115.30,P均<0.01);模型2和3的灵敏度和特异度均高于模型1,模型2的特异度低于模型3,差异均有统计学意义(χ2=131.65、64.15、207.60、262.03、96.73,P均<0.01);模型4和5的灵敏度均高于模型1~3,模型4和5的特异度均低于模型1~3,差异均有统计学意义(χ2=151.16、165.49、71.35、112.47、132.62、153.14,176.93、74.62、14.09、15.47、6.02、5.80,P均<0.05)。以病灶为单位的视频测试结果显示,医师1~4的平均准确度为68.16%;模型1~5的准确度分别为69.47%(66/95)、69.47%(66/95)、70.53%(67/95)、76.84%(73/95)和80.00%(76/95)。模型1~5之间、模型1~5与医师1~4之间的准确度比较差异均无统计学意义(P均>0.05)。结论基于深度学习的ME-BLI早期胃癌识别模型具有较好的准确度,但诊断效果略差于ME-NBI模型;ME-NBI联合ME-BLI早期胃癌识别模型的诊断效果优于单独模式下的模型;增加ME-NBI图片数量,尤其是早期胃癌图片,可以提高ME-NBI模型的灵敏度,但特异度有所下降。
简介:摘要目的评估人工智能(artificial intelligence,AI)辅助胃癌诊断系统在实时染色放大内镜视频中对内镜医师识别胃癌能力的影响。方法回顾性收集2017年3月—2020年1月武汉大学人民医院和公开数据集中的早期胃癌和非癌染色放大内镜图片作为训练集和独立测试集,其中训练集包括4 667张图片(1 950张早期胃癌和2 717张非癌),测试集包括1 539张图片(483张早期胃癌和1 056张非癌)。利用深度学习进行模型训练。前瞻性收集2020年6月9日—2020年11月17日来自北京大学肿瘤医院和武汉大学人民医院的100例患者的染色放大内镜视频(包含38例癌和62例非癌)作为视频测试集。纳入来自另外4家医院的4名不同年资内镜医师,分2次(无或有AI辅助)对视频测试集进行诊断,评估AI对内镜医师判断胃癌能力的影响。结果无AI辅助时,内镜医师诊断视频测试集中胃癌的准确率、敏感度和特异度分别为81.00%±4.30%、71.05%±9.67%和87.10%±10.88%;在AI辅助下,内镜医师辨认胃癌的准确率、敏感度和特异度分别为86.50%±2.06%、84.87%±11.07%和87.50%±4.47%,诊断准确率(P=0.302)和敏感度(P=0.180)较无AI辅助时均有提升。AI在视频测试集中辨认胃癌的准确率为88.00%(88/100),敏感度为97.37%(37/38),特异度为82.26%(51/62),AI的敏感度高于内镜医师平均水平(P=0.002)。结论AI辅助诊断系统是染色放大内镜模式下辅助诊断胃癌的有效工具,可提高内镜医师对胃癌的诊断能力。它能实时提醒内镜医师关注高风险区域,以降低漏诊率。
简介:摘要目的比较随机裁剪图片深度卷积神经网络识别模型(DCNN-C)和整张图片深度卷积神经网络识别模型(DCNN-W)2种基于不同训练方法的人工智能系统在染色放大内镜下辅助识别早期胃癌的能力。方法回顾性收集武汉大学人民医院内镜中心窄带成像和蓝激光成像2种染色放大内镜模式下的早期胃癌或非癌图片和视频片段,用于DCNN-C和DCNN-W的训练集和测试集。比较DCNN-C和DCNN-W在图片测试集中,以及DCNN-C、DCNN-W和3名高年资内镜医师(平均水平)在视频测试集中识别早期胃癌的能力。统计学方法采用配对卡方检验和卡方检验。观察者间的一致性以Cohen′s Kappa统计系数(Kappa值)表示。结果在图片测试集中,DCNN-C诊断早期胃癌的准确度、灵敏度、特异度、阳性预测值分别为94.97%(1 133/1 193)、97.12%(202/208)、94.52%(931/985)、78.91%(202/256),分别高于DCNN-W的86.84%(1 036/1 193)、92.79%(193/208)、85.58%(843/985)、57.61%(193/335),差异均有统计学意义(χ2=4.82、4.63、61.04、29.69,P=0.028、=0.035、<0.001、<0.001)。在视频测试集中,高年资内镜医师诊断早期胃癌的准确度、特异度和阳性预测值分别为67.67%、60.42%、53.37%,分别低于DCNN-C的93.00%、92.19%、87.18%,差异均有统计学意义(χ2=20.83、16.41、11.61,P<0.001、<0.001、=0.001);DCNN-C诊断早期胃癌的准确度、特异度和阳性预测值分别高于DCNN-W的79.00%、70.31%、64.15%,差异均有统计学意义(χ2=7.04、8.45、6.18,P=0.007、0.003、0.013);高年资内镜医师诊断早期胃癌的准确度、特异度、阳性预测值与DCNN-W比较差异均无统计学意义(均P>0.05);高年资内镜医师、DCNN-W和DCNN-C诊断早期胃癌的灵敏度分别为80.56%、94.44%、94.44%,差异均无统计学意义(均P>0.05)。一致性分析结果显示,高年资内镜医师与金标准的一致性一般至中等(Kappa值=0.259、0.532、0.329),DCNN-W与金标准的一致性中等(Kappa值=0.587),DCNN-C与金标准的一致性极高(Kappa值=0.851)。结论当训练集相同时,DCNN-C识别早期胃癌的能力优于DCNN-W和高年资内镜医师,DCNN-W与高年资内镜医师水平相当。