山东协和学院 山东 济南 250107
摘 要: 随着计算数学和信号处理技术的发展,基于深度神经网络的目标检测算法获得了比传统模板匹配算法更优的结果。深度 学习目标检测算法分为一阶段目标检测(one-stage)和两阶段目标检测(two-stage)两类。常见的一阶段目标检测算法有 YOLO算法、SSD算法。一阶段目标检测算法的优势在于利用回归的思想直接通过图像得到预测目标框信息,速度快。二阶段目标检测算法在精度方面要优于前者,例如R-CNN、Fast-CNN等,其策略是先利用网络产生一系列的候选框,然后进行分类和回归,虽然其精度相较一阶段算法准确度更高,但是速度方面相差甚远。
关键词:图像检测;图像识别;SSD检测
综上所述,遥感图像处理在社会发展中发挥的作用日益广泛。然而,基于目前的遥感图像目标检测算法仍存在准确性低、检测速度慢的问题,并且硬件负荷也越来越高。为显著降低对硬件算力的需求,提高处理时效性,本论文根据深度学习 目标检测算法遥感图像飞机舰船目标检测进行探究,探究对遥感图像飞机舰船的快速检测,为未来实现星上遥感图像目标检测提供技术支撑。
基于深度学习目标检测算法n主要分为2类:—类是基于候选区域( Region Proposal)的深层卷积神经网络两步骤框架算法,即 R-CNN系列;另一类是基于边框回归的单步骤单网络框架一阶段算法,即Yo-LO。SSD系列。前者将目标检测分为2步,首先提取图片中目标可能存在的子区域,然后将所有的子区域作为输入,使用卷积神经网络进行特征提取,最后进行检测分类。和边框回归修正。最早提出的基于CNN的目标检测算法是R-CNN算法“8”相比传统算法,它带来了30%的准确率提高。R-CNN算法的思路是:首先利用选择性搜索( Selective Search,ss)方法生成上千个候选框区域,然后利用卷积神经网络将这些图像分割出来,得到固定大小图像的轮廓﹑色彩等特征,提取这些特征后,再利用支持向量机( SVM)进行分类,完成分类任务,最后再对候选区域边界框进行微调。Faster R-CNN”于2015年NIPS上应运而生,它摒弃了Selective Search 操作,并引入ROI Pooling层以及RPN,比原始的R-CNN算法的准确度精度显著提高,减少了计算量并提高了检测速度,至今在目标检测算法中发挥着重要作用。其思想也被应用于多个目标检测和分割场景中,并取得良好效果。
现如今,在医学CT影像检测和识别领域中使用 最广泛的算法是 Faster R-CNN 和 YOLO 模型。前者因为 RPN 网络和 anchor box 机制,被测目标的预测相对准确,但是在面对一个两癌患者拥有成百上千的两癌CT图像时,其计算量较大,检测速度还不够快; 后者算法相对简洁,通过全连接得到的候选框,经训练就能将检测信息全部得出。
本文中所使用的数据集来自 LUNA16 数据集,来源于 LIDC-IDRI。LUNA16 全称是 Lung Nodule A-2020基于目标检测算法的两癌辅助诊断系统 3 nalysis 16,是于 2016 年推出的一个质量高、数量大的 两癌CT 影像检测数据集,在当前两癌检测算法研究中最具有权威性和代表性。LUNA16 数据集总共包含888 幅三维两癌 CT 图,由4名专业的放射科医生通过两阶段标注,总共包含 36378 个标注信息, 其中有1186 个肺结节。LUNA16 数据集组成主要包括4个部分: 原始CT 文件、两癌位置标注文件、原始 CT部区域分割文件与诊断结果文件。数据标注信 息是以 csv 格式储存,其中一个列出所有候选结节的位置和直径,另一个是诊断结果文件,包含标记为结节的直径信息和坐标信息。数据预处理方法如下: 提取病例数据信息。本文所使用的文件处理工具包是 Python 中的 SimpleITK 库,提取mhd 文件中包含 CT 图像的内容,以及raw 文件中的整个数据内容,并将其可视化。
已知在mhd格式中,坐标体系是mm为单位的体素值,在csv文件中记录了结节的位置,是CT scanner坐标轴里面相对原点的mm值,其中coordX 、coordY 、 coordZ、diameter _mm代表结节的位置和直径,需要将其转换到真实坐标轴位置,坐标转化如下图所示。最终图像数据是以512x512数组的形式给出。
由于CT图像中3条轴的像素距离不同,需要将各轴的像素距离归一化到1 mm。用这种归一化的方法来处理肺部数据,可以保留CT影像中的主要信息。根据CT值和HU( Hounsfield Unit)值的换算关系,归一化的实质是将值划分在[-1000 ,+400]范围内,将超过此范围的值截断为0,窗位表示图像的灰阶中心位置,本文设置为-600。
4 基于目标检测算法的图像分析
本文采用阈值分割法来实现对肺实质的分割和提取。肺实质的阈值分割方法主要是通过医学 CT 图像的灰度图,根据背景在灰度值上的差异,通过设定合适的阈值,扫描原值图像的像素点值进行比较,并判断属于背景还是待提取的实质,从而产生二值图像。
数字图像处理中二值化分割主要思想是根据灰度图像阈值分割的结果,将亮度大于阈值的区域像素值统一为最大值(0,0,0),即黑色;将亮度小于阈值的像素值统一设置为(255,255,255),即白色,通过每个点的二值化得到最终的图像。
癌症区域还留有部分多余的空气、CT床等边界部分,将边界信息去除。
在识别检测中,需要把处于肺实质外的床板区域剔除,因此需要计算将上一步得到的图片连通域,经过对比保留左右肺叶的最大连通域,从而忽略其他连通域。
腐蚀操作,步骤能够去除某些区域的冗余颗粒状,分离肺实质中附着在血管上的肺结节;闭运算顺序是先膨胀后腐蚀处理"可以消除凹陷,填充肺实质内部的微小空隙。
5 总结
本文在基于深度学习的两癌检测方法上,设计了两癌辅助诊断系统,通过训练好的数据模型检测两癌CT影像,用户面向医疗人员,尽可能实现精简化操作,实现人机交互式操作,减轻医生的负担,降低两癌诊断的误诊和漏诊率。本系统采用模块化方法,将整个系统划分为多个功能模块,再对模块进行设计,能够降低系统的复杂度,便于程序设计﹑修改和维护。
参考文献
【1】黄汉文 海洋目标天基综合感知技术[J]。 航天电子对抗,2019。
【2】王彩云 目标检测的研究进展[C]//中国计算机用户协会网络应用分会
【3】2019 年第二十三届网络新技术与应用年会。
作者简介:
吴甲盛,男,2001年6月,山东济宁人,山东协和学院数字媒体技术专业学生。
张浩,男,2001年8月,山东滨州人,山东协和学院计算机科学与技术专业学生。
陈世豪,男,2001年3月,山东滨州人,山东协和学院人工智能专业学生。
王晓燕,副教授,指导老师,山东协和学院数字媒体技术专业教师,主要研究方向:虚拟现实技术。