某部运输保障室
摘要:汉字识别属于模式识别的范畴。通常的汉字识别方法可分为两类:一是基于汉字结构(笔画特征)的结构识别;一是基于汉字统计特征的统计识别。但他们各有优缺点。本文主要探讨了大数据时代目前主要的车牌汉字识别方法,为汉字识别的实际应用打下基础。
关键词:大数据;车牌汉字;汉字识别
引言
文字是人类思想的载体,是交流的工具。进入大数据信息时代后,原来依靠图形记载在纸上的文字有了电子化以序号为代表的记载方式。这就产生了图形文字与编码序号之间的转换问题。由编码序号到文字图形是计算机输出,而由文字图形到编码序号就是文字识别。文字识别是模式识别的一个重要研究方向在办公自动化、快速信息处理、机器视觉等多方面有着重要的理论意义和实用价值。
近年来,随着国内经济的快速增长,汽车工业和交通运输产业迅速发展,对智能交通系统提出了更高的要求,包括移动车辆稽查、高速公路收费站管理、停车场(小区)车辆管理等在内的一系列智能管理系统应运而生。在上述智能系统中,字符识别都是其核心内容,而汉字识别(ChineseCharaeterRecognition,CCR)又是字符识别的重点和难点所在。如何进一步提高汉字的识别率,降低拒识率和误识率,提出有针对性的汉字识别解决方案,仍有许多工作要做,这也正是本文对汉字识别方法进行研究的目的所在。
一、车牌汉字识别方法
汉字识别属于模式识别的范畴,通常的汉字识别方法可分为两类:一是基于汉字结构(笔画特征)的结构识别;二是基于汉字统计特征的统计识别。结构模式识别方法的优点是可以识别复杂的模式,缺点是需要进行笔画提取。在统计模式识别方法中,特征提取方便,识别速度与识别对象无关,但需要得到汉字集的稳定特征,且在汉字笔画较多时要求的特征量非常巨大。从一般应用来看,二者各有优缺点。
具体说来汉字识别方法常用的有模板匹配法、统计特征匹配法、人工神经网络识别法等。
(一)模板匹配法
这个方法是把输入的字符直接和标准的字符原型进行比较,找到与之最匹配的模板。模板匹配对噪声、倾斜、形变等因素影响很敏感,而且对字符的字体风格不具有适应性。但考虑到车牌中出现的汉字的有限性(一般有四十多个汉字),仍然可以考虑构建标准汉字模板库来进行模板匹配。但在实际研究中我们发现,二值化的图形模板虽然直观,但其匹配计算过程过于简单直接,对倾斜、形变、残损、模糊的待识别字符匹配误差较大,因此鲁棒性较差。而灰度模板由于色彩、光照等因素影响,难以找到普遍适用的模板形式实现直接的匹配计算。在此基础上提出的基于二值图形变动分析的模糊模板匹配方案,可以获得更好的识别效果。下面做一简单介绍。
首先,选取图像质量较好的汉字,规格化为17×34像素的标准大小并完成二值化,归类保存。然后,将归类的多幅二值图形对齐后叠加,再标难化,形成模板库。
进行匹配识别时,对一幅切分后的待识别汉字灰度图,先将其规格化为17×34像素的标准尺寸,然后,将各象素点的灰度值线性变换到[0,1]区间,再与模糊图形模板匹配,计算Manhattan距离或Euchd距离,其最小距离值对应的模板汉字即为匹配识别输出的结果。
该方法的优点是不用对灰度图像作二值化处理,避免了由于二值化带来的图像信息损失。特别是对一些模糊图像,若直接二值化,效果较差,影响匹配准确度。对于原始图像明暗程度不同的图像,其平均值与对应模板的平均值并不一致,直接用Manhattan距离或Euclid距离进行匹配,会带来较多的计算误差。因此,可以考虑引入归一化的相关性度量公式,避免由于明暗和对比度变化导致图像和模板的“能量”不一致带来的匹配误差,进一步提高匹配准确度。
(二)统计特征匹配法
汉字的统计模式识别将字符点阵看作一个整体,从这个整体上经过大量统计得到所用特征,用尽可能少的特征模式来描述尽可能多的信息,抗干扰性强,在实际应用中使用率较高。
根据所提取特征的类型,特征统计的方法有下面几种:
(a)整体变换分析法:对字符图像进行二进制变换(如walsh,Hadamard变换等)或更复杂的变换(如Fourier,Hough变换等)变换后的特征维数大大降低。但这些变换不是旋转不变的,对于倾斜变形的字符识别会有较大偏差。二进制变换虽然计算简单,但没有明显的物理意义。复杂的变换通常运算量太大,难以实用。
(b)几何矩(GeometricMoment)特征。利用矩不变量,统计多个矩作为特征,进行匹配识别。但移不变、比例不变的几何矩只在线性变换下成立,实际环境中,很难保证线性变换这一前提条件。
(e)Spline曲线拟合与傅立叶描绘子(FourierDescriptor)特征。这两种方法都是提取字符图像的轮廓特征。SPline曲线拟合是在轮廓上找到曲率大的折点,利用SPline曲线来近似相邻折点之间的轮廓线,因此对于目标旋转很敏感。Fourier描绘子利用Fourier函数拟合封闭的轮廓线,将Fourier函数的各个系数作为特征,因此对于笔划断裂,轮廓线不封闭的字符图像不适用。
(d)笔划密度特征描述了汉字各部分笔划的疏密程度,提供了比较完整的信息。在脱机手写体汉字识别等图像质量可以保证的前提下,该特征相当稳定。但在字符内部笔划粘连时误差大,不适用。当然还有许多种不同的统计特征,如字符投影特征、外围特征、微结构特征、特征点特征等。这些方法都具有各自的优缺点,应根据具体应用场合进行选取。也可以适当采取多种特征相结合的方法。
(三)人工神经网络识别方法
人工神经网络(Artificial Neural Network,ANN)是仿生学的产物,它模拟人脑神经元细胞的网络结构,由大量简单的基本元件——神经元相互连接成自适应的非线性动态系统。
ANN中,各个神经元的结构和功能较为简单,但大量简单神经儿的组合却可以非常复杂,从而可以通过神经元间的连接系数来存储信息并完成分类、识别等复杂功能。ANN还具有一定的自适应的学习和组织能力,组成网络的各“细胞”可以并行工作。通过学习,根据训练样本集来调整“细胞”间的连接系数,从而构造出相应的分类曲面。
多层感知器(MLP)神经网络是目前应用最广泛的前向神经网络模型。在学习阶段由BP算法完成网络参数设定,首先提取己有样本(训练集)的特征进行训练,得到上下层神经元之间稳定的连接权值,从而构建一个ANN识别系统。已证明不限结点和隐层数目时MLP可以从理论上拟合任意连续分类曲面。有研究表明MLP的输出趋近于特征点属于各类别的后验概率估计。MLP结点大多使用sigmoid输出函数,是一种非线性拟合方法。由于训练集样本远少于真实样本数目,因而训练往往不能达到全局最优,一般情况下停止于局部极小点。当训练集足够大且有代表性时,一旦训练好MLP就可以很方便的直接用于识别,达到很好的识别效果。因此在车牌字符识别中得到了广泛的应用。
还有许多ANN模型,如PNN、自组织神经元树等,可应用于OCR领域。目前看来,由于不同分类器的错误分布不同,各识别子系统选用不同的分类器会带入多余信息,如果能解决多识别器系统集成的方法问题,实现多识别器的有效融合,应该会得到更佳的识别效果。
二、结论
本文针对车牌识别中应用的一些汉字识别方法进行了研究旨在能够更好的运用他们通过研究各种方法的优缺点以利于在车牌识别系统中更好的应用。
参考文献
[1]赵丹青,孙德宝.字符识别在车牌识别中的应用[J].中南民族大学学报(自然科学版).202221(3):33-36
[2]郭宏,丁晓青,郭繁夏,吴佑寿.汉字识别多分类器集成的新方法[J].清华大学学报(自然科学版).2022.37(10):91-94.