基于深度学习的计算机图像识别技术

(整期优先)网络出版时间:2022-04-28
/ 2

基于深度学习的计算机图像识别技术

赵阳 李国祥 董晓峰 胡涛 刘玉

北方自动控制技术研究所 山西太原 030006

摘要:随着计算机技术不断发展和应用的日益普及,以机器学习为代表的人工智能技术在图像处理、语音处理和自然语言理解等方面得到了越来越广泛的应用。在图像处理和识别应用中,人脸识别、行人识别、目标跟踪、车牌识别等技术已经得到广泛普及,并开始影响人类生活方式发生变化。深度学习的发展无论对计算机视觉领域还是对机器学习领域的研究都产生了巨大的影响。如今,新的深度学习技术正在不断诞生。其对大众的生活已经产生了深远的影响。鉴于此,文章对深度学习在图像识别中的应用进行了研究,以供参考。

关键词:深度学习;图像识别;应用研究

1深度学习概述

深度学习是机器学习中一种基于数据进行表征学习的方法,在机器学习领域,深度学习开辟了全新的方向,旨在研究如何从数据中自动地提取多层次特征表示,其核心思想是通过数据驱动的方式,采用一系列的非线性变换,从原始数据中提取多层次多角度特征,从而使获得的特征具有更强的泛化能力和表达能力,这恰好满足高效图像处理的需求。常用的深度学习方法:(1)受限波尔兹曼机受限波尔兹曼机是由Smolensky在波尔兹曼机基础上提出的,由显性变量和隐性变量构成。其中显性变量和隐性变量之间存在映射关系,但它们内部均不会存在连接,它的训练方式主要是基于对比散度的快速学习算法。(2)和解译器两部分构成。编码器的作用是将输入的信号压缩表示传递给下一层网络,解译器的作用是解释编码器压缩重建的数据信号,传递输出信号。这两部分在本质上是一样的作用,都是对输入的信号进行某种变换从而复原输入信号。(3)卷积神经网络卷积神经网络通常包含卷积层、降采样层、全连接层与输出层。它的特点在于,采用原始信号直接作为网络的输入,避免了传统识别算法中复杂的特征提取和图像重建过程。其中,卷积层的作用是进行特征提取。对于一幅图像,一层卷积层中包含多个卷积核,每个卷积核都能与输入图像进行卷积运算产生新的图像,新图像上的每个像素即代表着卷积核所覆盖的一小片区域内图像的一种特征表示,用多个卷积核分别对图像进行卷积即可提取不同种类的特征。卷积神经网络是一种深层前馈型神经网络,最常用于图像领域的监督学习问题,比如图像识别、计算机视觉等。

2深度学习技术优势分析

传统图像识别一般是通过人工采集样本,然后由经验丰富的人员在镜下进行观察,其主观性强,判断较为复杂,周期较长。比起人工设计的提取器,深度学习技术改变了图像识别需要专业知识和复杂技术的缺点,提升了泛化能力和鲁棒性差的问题。传统方法能够检测背景固定且简单的图像,比如在零件识别领域。但是在复杂图像的领域就需要深度学习,比如识别一只老虎这样的多高级的、语义级别的场景。越是复杂和创造性的问题,深度学习方法就是越能识别其图像,而且还可实现端到端训练、无需专业知识和复杂技术调参,实现从人工认知驱动向数据驱动的转变。

3图像识别技术

图像识别技术主要利用计算机的功能来对图像信息进行处理、分析、理解,基于计算机得出的结果即可判断不同属性的目标。在某种程度上,图像识别技术即是模仿、强化人类本身对图像信息识别的机能,能够通过计算机功能代替人类去自动处理、分辨图像物理信息,同时能够对人类难以识别、观察的信息进行处理,以此降低人工作业的负担。在现代的技术水平之下,图像识别技术又属于人工智能化技术的范畴,其能够针对每个图像的特征进行分析,并对在进行图像识别时产生的眼动进行表明。图像识别技术的原理是根据技术的信息识别结果,在自身数据存储库中寻找相似性的数据原型,进而来对图像进行识别。

4深度学习在图像识别中的具体应用

4.1人脸识别

在现实生活中,人脸识别技术的应用非常广泛,如电子商务、门禁系统以及视频监控等方面,而对人脸识别系统的建设需要有相应的技术手段作为支持,包括身份查找、人脸识别预处理、人脸定位以及人脸图像采集等。在具体研发期间,人脸识别系统会涉及到诸多模块,例如,图像质量检测、真人鉴别、人脸建模、人脸识别对比以及人脸跟踪捕捉等。其中,最为核心的技术就是人脸识别对比,其正确率会对系统的精确度造成直接的影响。而深度学习技术在研发和应用以前,人脸识别算法大多是以LBP、LDA、PCA以及相关改进算法为主的,但由于传统形式的识别算法具有一定的局限性,即对比精度不高,导致系统整体识别率难以达到预期效果。而随着科技的进步,目前深度学习技术也得到了快速的发展,这在一定程度上推动了深度学习技术和人脸识别技术的融合,也在此基础上诞生了相应的人脸识别算法,相比于人脸识别算法,其识别精度要高出许多。特别是在卷积神经网络逐渐兴起的情况下,人脸识别技术逐渐成为了深度学习研究的主要方向之一,而相对成功的模型包括DeepID以及DeepFace这两种,尤其是DeepID模型,针对卷积神经网络的内部结构进行了深入的分析和研究,这对人脸识别技术的深入发展及应用具有非常积极的作用。而尽管人脸识别技术在近些年当中得到了快速的发展,但仍然有很多问题存在。例如,怎样对长相接近的人进行识别,如双胞胎;怎样对人脸各年龄段的变化进行准确的判断;怎样防止人脸信息被盗用;怎样降低外部因素对于人脸识别精度的影响等等,而这些问题还需要相关领域对深度识别技术进行更为深入的研究,使其能够在图像识别中发挥更大的作用。

4.2医学图像识别

医学图像识别的主要目标是从海量的医学图像中高效、准确的提取出有用的病理信息,为医学研究、临床诊断以及疾病治疗提供坚实的基础。目前,卷积神经网络已成为医学图像识别的首选算法,卷积神经网络以卷积算法、池化算法为基础,逐步提取目标图像中的病理信息,将提取到的图像特征集合成高阶特征,从而完成医学图像的识别与诊断回。在学习大量的样本图像后,深度学习算法获取的特征信息完全有可能超过医生的实践经验,可以站在专家的高度做出高效的判断,既减轻了医生的负担,又提高了诊疗的效率与准确性,对现代医学的发展具有重要的意义

4.3视频图像分析

虽然在视频图像分析方面也对深度学习进行了适当的应用,但其目前仍然处在起步阶段,借助深度学习对视频静态图像进行描述较为容易,而相关的深度学习模型则完全可以从ImageNet上进行获得,但在深度学习中怎样对视频动态特征进行描述还是一项较为困难的问题。这主要是由于传统视频研究方法是借助动态纹理以及光流估计描述动态特征的,但深度模型却并不能对各种动态特征的相关描述信息进行体现。而针对上述问题,一方面可以将视频图像看做三维图像,并在卷积网络当中对其进行合理的应用。另一方面是实施预处理,实现光流场及其他动态特征空间场分布的有效计算,并且要将其视为一个卷积网络的通道。

结语

综上所述,目前,我国的图像识别技术得到了广泛的应用并切实的融入了日常生活之中。但图像识别技术发展较为完善的内容仍然停留在人脸识别技术,无法在更多的领域得到良好的应用。深度学习就是将大数据融入图像识别技术,利用图像识别技术将图像中的信息进行检索总结,并且在大数据中筛选相对应的内容,反馈给图像提供方,以保障图片识别技术的准确性。

参考文献

  1. 郑远攀,李广阳,李晔.深度学习在图像识别中的应用研究综述[J].计算机工程与应用,2019(12):20-36.

[2]张文强.基于深度学习的商品检测和识别研究[D].成都:电子科技大学,2019.

[3]付文博,孙涛,梁藉,等.深度学习原理及应用综述[J].计算机科学,2018,45(6A):11-12.