车牌识别: 基于模板匹配和神经网络的车牌字符识别方法

2008年7月15日星期二

基于模板匹配和神经网络的车牌字符识别方法

1 引言
车牌识别技术是智能交通系统的重要组成部分的，是集机器视觉、模式识别、人工智能等技术为一体的复杂处理过程。要求识别精度高、处理时间短，能满足实际应用的需要。目前最常用的车牌字符识别方法是基于神经网络和模板匹配的方法。文献[1-4]给出了基于神经网络的车牌字符识别方法，对于解析度较高(车牌区宽度不小于120个像素)和图像比较清晰的车牌，这些方法能有效地识别车牌中的字符，但是对于较低解析度和较为模糊的车牌，以上方法是不可行的，因为这些方法只有在车牌中的每一字符独立分割出来的前提下才能完成识别工作，而独立分割车牌区的字符，对较低解析度和较为模糊的车牌来说是非常困难甚至是不可能的。文献[5]提出了一种基于模板匹配的车牌识别方法，只需提取字符区整体特征，避免了字符的分割，能有效地完成低解析度和模糊的车牌字符识别，但字符识别时间太长。本文提出了一种改进的神经网络和一种四灰度加权相关函数模板匹配集成方法来进行字符识别，使车牌字符识别的精度和实时性得到了改善。

2 模板匹配字符识别方法
中国车牌的字符分成4类，即汉字、字母、数字和点号(“l”)。汉字为各省或直辖市的简称或军种的简称。字母为a～z英文字母。数字为0～9。

标准模板匹配法识别车牌字符之前，对已定位好的车牌区需进行标准化，标准化的目的是使车牌区的字符和标准模板的匹配特征相适应。通常取标准模板为二值化图像模板(取车牌区字符为1像素，背景为0像素)，同时车牌标准化后得到的车牌图像也为二值图像。匹配是以距离或相似函数作为依据的。本文提出的基于四灰度的加权相似函数的判别准则，既可保证字符识别的精度和稳定性，又具有满意的识别速度。

四灰度是将模板和车牌标准化为a,b,c,d 四种灰度值的图像。通过对实际采集的车牌灰度图像进行分析发现:字符的灰度值a、背景的灰度值b、背景和字符之间的边界灰度值(分字符的边界靠字符处的灰度值c、背景的边界靠背景处的灰度值两类d)之间有较明显的界限。取模板的大小为m×n像素(如8×16，8为模板的列数，16为模板的行数)，则模板和用于匹配的车牌中对应区域的像素的灰度值可用gm×n和fm×n矩阵表示，同时，定义模板和匹配车牌区之间的相似矩阵为
sm×n，这3个矩阵分别为

运算的值实际上是加权值，sm×n函数实际上是一个模板和所处理的对应车牌区像素之间的相似程度的加权和。事实上，加权值合理地反映了字符、背景、字符边界和背景边界位置之间的联系。实验表明:这种加权相似函数法与交叉相关函数法相比具有同样的匹配正确率，且运算量不到交叉相关函数法的0.1%。

中国车牌的字符模板分为汉字、英文字母和数字模板，由统计方法构造这些模板并保存到数据库中[3]。模板匹配是将字符模板和标准化了的车牌区字符进行匹配来识别字符。

匹配步骤如下:
(1) 步骤1: 根据不同车牌类型的字符组合先后顺序(如小型汽车的顺序为汉字－0或英文字母-英文字母或数字)取字符模板。

(2) 步骤2: 依次取汉字模板进行匹配，模板在车牌字符区上左右滑动(滑动的目的是为了找到最好的匹配位置)。模板以车牌字符区最左边为起点，向左和向右分别滑动几个像素(取2～3个像素)，计算每个位置每个汉字模板的m值，取最大的m值对应的模板为最匹配的模板。若m值大于阈值t，则可确定为所识别的汉字，否则拒绝识别汉字。此时得到了最佳匹配时模板在车牌字符区中的右边界位置s1。

(3) 步骤3:依次取英文字母，以s1为起点，进行类似步骤2的计算找到最匹配的模板，并进行识别。同时得到新的模板在车牌字符区中的右边界位置，更新s1。

(4) 步骤4: 取全部英文字母和数字，以s1为起点(有分隔符的地方再加分隔符的宽度w)进行类似步骤3的计算，重复至7个字符全部识别完成。

实验表明:对汉字的识别阈值t值取85%，对英文字母和数字阈值t值取80%可得到最好的匹配效果。对同一车牌的字符识别四灰度加权相似函数法识别率和文献[5]采用的交叉相关函数法识别率相近，但识别时间不到文献[5]采用的交叉相关函数法的5%;四灰度加权相似函数法识别率比二值图为基础的模板匹配法至少高15%，而识别时间基本相同。

3 神经网络字符识别
本文采用三层神经网络对字符进行识别，并针对车牌图像的特点，对传统的bp算法进行了改进。实验表明，改进后的神经网络可以提高识别率1%-3%，提高网络的收敛速度30%-50%。

3.1 改进误差函数
本文采用lee(最小指数误差)误差函数算法，可有效地提高神经网络的性能。lee误差函数为

式中e为lse 函数。采用lee误差函数可以加快网络的学习收敛速度，避免收敛过程出现振荡现象。

3.2 改进样本学习规则
传统的bp学习算法是一种随机梯度最小均方算法，每次迭代的梯度值受样本中噪声干扰的影响较大，所以有必要使用批处理方法将多个样本的梯度进行平均以得到梯度的估值．但是，在训练模式样本数很大的情况下，这种方法势必增加每次迭代的计算量，并且这种平均作用将会忽略训练样本个体的差异性，降低学习的灵敏度。因此，本文的做法是将所有训练模式样本分成若干个子块分别进行平均学习，当误差收敛到一预定数值时，再以此刻权值为初值，转入下一子块进行学习，在所有的子块被训练完后，若最后的误差达到预定的精度，则学习完毕，否则将转入下一个循环继续学习，直到满足识别精度的要求。

3.3 采用分组神经网络
根据车牌类型和字符类型将神经网络分成3个子网学习。这3个子网分别是汉字子网、数字和英文字母子网。各子网中的节点数可根据不同的特点来设置。分组子网可以降低网络的复杂性，提高网络的识别率。

4 结束语
由于车牌采集的条件(场景、几何位置、灯光、天气、车辆速度和摄象机的解析度等)不同，由定位得到的车牌中的字符有的可以独立分割出来、有的可以部分分割出来、有的则不能分割出来。对于不能独立分割出来的车牌字符，只能采用模板匹配的方法进行识别;而对于可将字符切分出来的车牌，可用模板匹配和神经网络的方法，但这两种方法识别的效果不一样。

对能对立分割出来的车牌字符，选择识别方法可根据实际系统要求确定。如:对于识别率要求高的系统(如在高速公路收费系统中应用的车牌识别系统)，应选择神经网络方法;对实时性要求较高的实际系统(如在车流量较大的城市道路或流量观测站中)，应选择模板匹配方法;对用于统计各种车辆，只需要识别汉字的场合应选择模板匹配方法。
采用用本文提出的方法，对从实际交通场景中获取的大量车牌图像进行识别，识别率超过92%，识别时间不超过1200ms，能较好地满足实际系统的要求。

参考文献
[1] fahmy m. m. m., computer vision application to automatic number-plate recognition. proceeding of 26th[d]. international symposium on automotive technology and automation, aachen, germany, 1993: 625-633.
[2] 刘效静,成瑜. 汽车牌照自动识别技术研究[j]. 南京航空航天大学学报, 1998,30(5): 573-576.
[3] 赵雪春,戚飞虎. 基于彩色分割的车牌自动识别技术[j]. 上海交通大学学报,1998,32(10): 4-9.
[4] john setchell. applications of computer vision to road-traffic monitoring. ph.d thesis. university of bristol[j]. england,1997: 66-81.
[5] m.notturmo granieri, f.stabile, p.comelli. recognition of motor vechicle license plates in rear-view images. image technology. jorge l.c.san2 coordinated sience laboratory univerity of illineis at urbana. usa,1993: 231-252.

作者简介
王敏女教授主要研究方向为图像处理和模式识别技术及人工神经网络。

没有评论:

发表评论

订阅：博文评论 (Atom)

2008年7月15日星期二

基于模板匹配和神经网络的车牌字符识别方法

没有评论:

发表评论

Google一下本博客