2008年7月15日星期二

基于模板匹配和神经网络的车牌字符识别方法

1 引言
车牌识别技术是智能交通系统的重要组成部分的,是集机器视觉、模式识别、人工智能等技术为一体的复杂处理过程。要求识别精度高、处理时间短,能满足实际应 用的需要。目前最常用的车牌字符识别方法是基于神经网络和模板匹配的方法。文献[1-4]给出了基于神经网络的车牌字符识别方法,对于解析度较高(车牌区 宽度不小于120个像素)和图像比较清晰的车牌,这些方法能有效地识别车牌中的字符,但是对于较低解析度和较为模糊的车牌,以上方法是不可行的,因为这些 方法只有在车牌中的每一字符独立分割出来的前提下才能完成识别工作,而独立分割车牌区的字符,对较低解析度和较为模糊的车牌来说是非常困难甚至是不可能 的。文献[5]提出了一种基于模板匹配的车牌识别方法,只需提取字符区整体特征,避免了字符的分割,能有效地完成低解析度和模糊的车牌字符识别,但字符识 别时间太长。本文提出了一种改进的神经网络和一种四灰度加权相关函数模板匹配集成方法来进行字符识别,使车牌字符识别的精度和实时性得到了改善。

2 模板匹配字符识别方法
中国车牌的字符分成4类,即汉字、字母、数字和点号(“l”)。汉字为各省或直辖市的简称或军种的简称。字母为a~z英文字母。数字为0~9。

标准模板匹配法识别车牌字符之前,对已定位好的车牌区需进行标准化,标准化的目的是使车牌区的字符和标准模板的匹配特征相适应。通常取标准模板为二值化图 像模板(取车牌区字符为1像素,背景为0像素),同时车牌标准化后得到的车牌图像也为二值图像。匹配是以距离或相似函数作为依据的。本文提出的基于四灰度 的加权相似函数的判别准则,既可保证字符识别的精度和稳定性,又具有满意的识别速度。

四灰度是将模板和车牌标准化为a,b,c,d 四种灰度值的图像。通过对实际采集的车牌灰度图像进行分析发现:字符的灰度值a、背景的灰度值b、背景和字符之间的边界灰度值(分字符的边界靠字符处的灰 度值c、背景的边界靠背景处的灰度值两类d)之间有较明显的界限。取模板的大小为m×n像素(如8×16,8为模板的列数,16为模板的行数),则模板和 用于匹配的车牌中对应区域的像素的灰度值可用gm×n和fm×n矩阵表示,同时,定义模板和匹配车牌区之间的相似矩阵为
sm×n,这3个矩阵分别为



运 算的值实际上是加权值,sm×n函数实际上是一个模板和所处理的对应车牌区像素之间的相似程度的加权和。事 实上,加权值合理地反映了字符、背景、字符边界和背景边界位置之间的联系。实验表明:这种加权相似函数法与交叉相关函数法相比具有同样的匹配正确率,且运 算量不到交叉相关函数法的0.1%。

中国车牌的字符模板分为汉字、英文字母和数字模板,由统计方法构造这些模板并保存到数据库中[3]。模板匹配是将字符模板和标准化了的车牌区字符进行匹配来识别字符。

匹配步骤如下:
(1) 步骤1: 根据不同车牌类型的字符组合先后顺序(如小型汽车的顺序为汉字-0或英文字母-英文字母或数字)取字符模板。

(2) 步骤2: 依次取汉字模板进行匹配,模板在车牌字符区上左右滑动(滑动的目的是为了找到最好的匹配位置)。模板以车牌字符区最左边为起点,向左和向右分别滑动几个像 素(取2~3个像素),计算每个位置每个汉字模板的m值,取最大的m值对应的模板为最匹配的模板。若m值大于阈值t,则可确定为所识别的汉字,否则拒绝识 别汉字。此时得到了最佳匹配时模板在车牌字符区中的右边界位置s1。

(3) 步骤3:依次取英文字母,以s1为起点,进行类似步骤2的计算找到最匹配的模板,并进行识别。同时得到新的模板在车牌字符区中的右边界位置,更新s1。

(4) 步骤4: 取全部英文字母和数字,以s1为起点(有分隔符的地方再加分隔符的宽度w)进行类似步骤3的计算,重复至7个字符全部识别完成。

实验表明:对汉字的识别阈值t值取85%,对英文字母和数字阈值t值取80%可得到最好的匹配效果。对同一车牌的字符识别四灰度加权相似函数法识别率和文 献[5]采用的交叉相关函数法识别率相近,但识别时间不到文献[5]采用的交叉相关函数法的5%;四灰度加权相似函数法识别率比二值图为基础的模板匹配法 至少高15%,而识别时间基本相同。

3 神经网络字符识别
本文采用三层神经网络对字符进行识别,并针对车牌图像的特点,对传统的bp算法进行了改进。实验表明,改进后的神经网络可以提高识别率1%-3%,提高网络的收敛速度30%-50%。

3.1 改进误差函数
本文采用lee(最小指数误差)误差函数算法,可有效地提高神经网络的性能。lee误差函数为

式中e为lse 函数。采用lee误差函数可以加快网络的学习收敛速度,避免收敛过程出现振荡现象。

3.2 改进样本学习规则
传统的bp学习算法是一种随机梯度最小均方算法,每次迭代的梯度值受样本中噪声干扰的影响较大,所以有必要使用批处理方法将多个样本的梯度进行平均以得到 梯度的估值.但是,在训练模式样本数很大的情况下,这种方法势必增加每次迭代的计算量,并且这种平均作用将会忽略训练样本个体的差异性,降低学习的灵敏 度。因此,本文的做法是将所有训练模式样本分成若干个子块分别进行平均学习,当误差收敛到一预定数值时,再以此刻权值为初值,转入下一子块进行学习,在所 有的子块被训练完后,若最后的误差达到预定的精度,则学习完毕,否则将转入下一个循环继续学习,直到满足识别精度的要求。

3.3 采用分组神经网络
根据车牌类型和字符类型将神经网络分成3个子网学习。这3个子网分别是汉字子网、数字和英文字母子网。各子网中的节点数可根据不同的特点来设置。分组子网可以降低网络的复杂性,提高网络的识别率。

4 结束语
由于车牌采集的条件(场景、几何位置、灯光、天气、车辆速度和摄象机的解析度等)不同,由定位得到的车牌中的字符有的可以独立分割出来、有的可以部分分割 出来、有的则不能分割出来。对于不能独立分割出来的车牌字符,只能采用模板匹配的方法进行识别;而对于可将字符切分出来的车牌,可用模板匹配和神经网络的 方法,但这两种方法识别的效果不一样。

对能对立分割出来的车牌字符,选择识别方法可根据实际系统要求确定。如:对于识别率要求高的系统(如在高速公路收费系统中应用的车牌识别系统),应选择神 经网络方法;对实时性要求较高的实际系统(如在车流量较大的城市道路或流量观测站中),应选择模板匹配方法;对用于统计各种车辆,只需要识别汉字的场合应 选择模板匹配方法。
采用用本文提出的方法,对从实际交通场景中获取的大量车牌图像进行识别,识别率超过92%,识别时间不超过1200ms,能较好地满足实际系统的要求。

参考文献
[1] fahmy m. m. m., computer vision application to automatic number-plate recognition. proceeding of 26th[d]. international symposium on automotive technology and automation, aachen, germany, 1993: 625-633.
[2] 刘效静,成 瑜. 汽车牌照自动识别技术研究[j]. 南京航空航天大学学报, 1998,30(5): 573-576.
[3] 赵雪春,戚飞虎. 基于彩色分割的车牌自动识别技术[j]. 上海交通大学学报,1998,32(10): 4-9.
[4] john setchell. applications of computer vision to road-traffic monitoring. ph.d thesis. university of bristol[j]. england,1997: 66-81.
[5] m.notturmo granieri, f.stabile, p.comelli. recognition of motor vechicle license plates in rear-view images. image technology. jorge l.c.san2 coordinated sience laboratory univerity of illineis at urbana. usa,1993: 231-252.

作者简介
王 敏 女 教授 主要研究方向为图像处理和模式识别技术及人工神经网络。

没有评论:

发表评论

欢迎访问、交流!对本博客有何建议,请
来信告知!
本博内容来源于网络,如有不当或侵犯权益,请来信告知,将及时撤除!
如引用博客内容、论文,请注明原作者!

Google一下本博客

  • 《Getting Things Done》读书笔记 - 本文来自 inertial 原创投稿。 我第一次听说《Getting Things Done》这本书的时候误以为它和世面上的那些成功学书籍没什么区别,后来在不少书中看到了这个名字,也看见了很多人的推荐,由此产生了很大的兴趣。上个月正好有不少空闲,就抽时间把这本书读完了。 本来打算读英文原版,但是原版的生...
    5 年前
  • [原]Linux下编译使用boost库 - Boost库是一个可移植、提供源代码的C++库,作为标准库的后备,是C++标准化进程的开发引擎之一。 Boost库由C++标准委员会库工作组成员发起,其中有些内容有望成为下一代C++标准库内容。在C++社区中影响甚大,是不折不扣的“准”标准库。Boost由于其对跨平台的强调,对标准C++的强调,与...
    6 年前
  • [原]猎头、培训与咨询的价值(2)【补1】——北漂18年(93) - 【上期用手机写的,同时用语音输入转化成文字,错字较多,经好友霍师傅提醒本期重写,并增加一部分新内容】 简单谈下我对猎头、培训与咨询的看法。三样都干过,算是有些浅见。 猎头 简单的说就是人才中介。虽然在公司看来是可以直接解决现有企业问题的一个直接方法,但很多时候都不太管用。 猎头费一般是人才的一个月月...
    6 年前
  • OpenCV統計應用-Mahalanobis距離 - Mahalanobis距離是一個可以準確找出資料分布上面極端值(Outliers)的統計方法,使用線性迴歸的概念,也就是說他使用的是共變數矩陣以及該資料分布的平均數來找尋極端值的產生,而可以讓一群資料系統具有穩健性(Robust),去除不必要的雜訊訊息,這邊拿前面共變數矩陣的資料為例,並且新增了兩個點座標向量來做...
    15 年前
  • 努力推进模式识别实际产品的开发与应用 - Salu 无论是手写体识别、文档处理、人脸识别、基于内容的图片搜索、嵌入人工智能的搜索技术、虚拟网络社区、还是其它相关新科技下的信息整合领域,现在都在努力实用化。 前两年、即使现在还有很多人在抱怨说人脸的方法都不能用,但是就今年出现的和正在做的有关人脸识别实际应用的各种形式的产品可以说如雨后春笋。这是一个趋...
    16 年前