2008年7月28日星期一

电子眼摄录,号牌识别原理

1.引言

车牌识别技术(Vehicle License Plate Recognition,VLPR)是计算机视觉和模式识别技术在现代智能交通系统中的一项重要研究课题,是实现交通管理智能化(Intelligent Transportation Systems,ITS)的重要环节。车牌自动识别系统是以数字图像处理、模式识别、计算机视觉等技术为基础的智能识别系统,它利用每一个汽车都有唯一的 车牌号码,通过摄像机所拍摄的车辆图像进行车牌号码的识别。在不影响汽车运行状态的情况下,计算机自动完成车牌的识别,可降低交通管理工作的复杂度。车牌 自动识别技术在车辆过路、过桥全自动不停车收费,交通流量控制指标的测量,车辆自动识别,高速公路上的事故自动测报,不停车检查,车辆定位,汽车防盗,稽 查和追踪车辆违规、违法行为,维护交通安全和城市治安,防止交通堵塞,提高收费路桥的服务速度,缓解交通紧张状况等方面有重要作用,因此VLPR技术研究 有重要的现实应用意义。VLPR系统拥有广阔的应用前景,由于装配一套全新的车辆探测器的硬件系统投资巨大,急需用纯软件实现的车牌自动识别系统来最大限 度的减少费用,在这样的背景下我们成功设计实现了一个基于改进BP神经网络模式的车牌自动识别系统。以下对其中的某些关键技术点作简要的讨论。



2 车牌字符识别相关技术简介

2.1 图像的灰度化

汽车图像样本目前大都是通过摄像机、数码相机等设备拍摄获取的,因而预处理前的图像都是彩色图像。彩色图像包含着大量的颜色信息,不但在存储上开销很大, 而且在处理上也会降低系统的执行速度,因此在对图像进行识别等处理中经常将彩色图像转变为灰度图像,以加快处理速度。由彩色转换为灰度的过程叫做灰度化处 理。灰度图像就是只有强度信息而没有颜色信息的图像,存储灰度图像只需要一个数据矩阵,矩阵每个元素表示对应位置像素的灰度值。彩色图像的像素色为 RGB(R,G,B),灰度图像的像素色为RGB(r,r,r),R,G,B可由彩色图像的颜色分解获得。而R,G,B的取值范围是0~255,所以灰度 的级别只有256级。灰度化的处理方法主要有如下三种:分别为最大值法、平均值法和加权平均值法。

2.2 图像的灰度拉伸

由于车辆牌照识别系统是全天候的,若没有理想的补充光照明,自然光照度的昼夜变化会引起牌照图像的对比度严重不足,使图像中牌照字符分辨不清,甚至根本无 法定位和分割,更无法识别。采用图像灰度拉伸的方法可有效地增强图像对比度,增强后的图像中字符清晰、区域分明,便于图像二值化和字符分割处理。

2.3 图像的二值化

二值图像是指整幅图像画面内仅黑、白二值的图像。在数字图像处理中,二值图像占有非常重要的地位。在实际的车牌处理系统中,进行图像二值变换的关键是要确 定合适的阀值,使得字符与背景能够分割开来,二值变换的结果图像必须要具备良好的保形性,不丢掉有用的形状信息,不会产生额外的空缺等等。车牌识别系统要 求处理的速度高、成本低、信息量大,采用二值图像进行处理,能大大地提高处理效率。二值化的阀值选取有很多方法,主要分为3类:全局阀值法、局部阀值法和 动态阀值法。全局阀值二值化方法是根据图像的直方图或灰度的空间分布确定一个阀值,并根据该阀值实现灰度图像到二值化图像的转化。全局阀值方法的优点在于 算法简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,但对输入图像量化噪声或不均匀光照等情况抵抗能力差,应用受到极大限制。局部阀值法 则是由象素灰度值和象素周围点局部灰度特性来确定象素的阀值的,Bernsen算法是典型的局部阀值方法,非均匀光照条件等情况虽然影响整体图像的灰度分 布却不影响局部的图像性质,局部阀值法也存在缺点和问题,如实现速度慢、不能保证字符笔划连通性、以及容易出现伪影现象等。动态阀值法的阀值选择不仅取决 于该象素灰度值以及它周围象素的灰度值,而且还和该象素的坐标位置有关,由于充分考虑了每个像素邻域的特征,能更好的突出背景和目标的边界,使相距很近的 两条线不会产生粘连现象。

2.4 图像的梯度锐化

由于需要处理的图像由拍摄而来,所以在很多情况下字符模糊,对识别造成了一定的困难,所以要对图像进行锐化处理使模糊的图像变的清晰,图像锐化的实质就是 增强图像的边缘或轮廓,其锐化后的结果通过微分而使图像边缘突出、清晰。图像锐化的方法有两种:梯度锐化法和高通滤波法。其中梯度锐化法比较常用,其中求 梯度的两种差分算法分别为水平垂直差分法和交叉差分计算法,此外还可采用Roberts、Prewitt和Sobel梯度算子。Roberts特点是边缘 定位准确,但对噪声敏感;Prewitt特点是平均、微分对噪声有抑制作用。事实证明,梯度锐化具有一定的去噪能力,但会对字符的边缘有所损伤。

2.5 图像的去噪

图像可能在拍摄或者传输过程中夹带了噪声,去噪声是图像处理中常用的手法。通常去噪用滤波的方法,比如中值滤波、均值滤波。

2.6 图像的倾斜矫正

由于拍摄时镜头与牌照的角度、车辆的运动及路面的状况等因素的影响,例如车牌在捕捉图像中的位置不固定,捕捉图像时车头或者镜头发生摆动以及车牌本身就挂 歪了或路况较差,都可能使拍摄到的车牌图像有一定的倾斜度,为了正确识别需要进行倾斜度校正,否则将无法进行单个字符的正确分割,字符识别的误差率就会上 升。但是若以某个固定的经验值对所有牌照统一进行旋转处理,又会使原本正常的牌照倾斜,导致新的错误。因此有必要针对特定的牌照图像提取其倾斜角度,再加 以相应的旋转处理。如何从牌照中自动提取其倾斜度是预处理过程中的一个难点,一般使用Hough变换检测图像中的直线来对图像的倾斜进行相应的矫正。

2.7 车牌边框和柳钉的去除

在实际处理中,面对要识别的牌照字符背景非常复杂,存在较大的干扰、噪声。当车牌的二值图像统一为黑底白字并经过对图像梯度锐化和去除噪声后,还会有汽车 保险杠与牌照四条边框的残缺图像以及牌照上两个铆钉干扰的一个区域。借助先验知识,可以采取图像处理方法从上述复杂背景中去除干扰。将车牌图像进行二值化 后,图像仅黑、白二值。白色像素点(灰度值255)取1,黑色像素点(灰度值0)取0,这里采用的是白底黑字模式。车牌图像中上下边框和铆钉的去除是很重 要的,没有去除边框线和铆钉的车牌图像,经常出现铆钉和字符及边框线粘连的现象,给后续车牌字符的分割造成很大的困难。在车牌边框线的内侧,通常有四个铆 钉,他们不同程度地与第2个字符或第6个字符粘连,如果不去除铆钉,将给第2和第6在字符的识别造成困难。

2.8 车牌字符分割

经过上面一系列预处理后,得到的是一条上下边缘紧贴字符的水平二值图像,其中,车牌的背景像素为白色,用1表示;车牌的字符像素为黑色,用0表示。在识别 时系统只能根据每个字符的特征来进行判断,为了最终能准确识别牌照上的汉字、英文字母及数字,必须将单个字符从矫正的牌照中逐个提取分离出来。

2.9 车牌字符特征提取

图像经过一系列变换后,原来大小不同、分布不规律的各个字符变成了一个个大小相同,排列整齐的字符。紧接着就要从被分割归一处理完毕的字符中,提取最能体 现这个字符特点的特征向量。将提取出训练样本中的特征向量输入到BP神经网络对网络进行训练后,就可以对字符进行识别。

2.10 字符识别方法

由于本系统字符识别相对比较复杂,涉及知识面较宽,有必要对字符识别方法略作讨论。

(1) 模板匹配车牌字符识别

中 国车牌的字符模板分为汉字、英文字母和数字模板,由统计方法构造并保存到数据库中。模板匹配是将字符模板和标准化了的车牌字符进行匹配来识别字符。优点是 对字符图像的缺损、污迹干扰适应力强,缺点是只适用于尺寸固定,车牌水平放置的情况,对字符的旋转、缩放、变形容忍度低。

(2) 特征匹配车牌字符识别

车牌识别的方法中,可利用的字符特征很多,大致可以分为结构特征、象素分布特征及其他特征:

l 结构特征。结构特征充分利用了字符本身的特点,由于车牌字符通常都是较规范的印刷体,因此可以较容易地从字符图像上得到它的字符笔画信息,并可根据这些信 息来判别字符。例如,汉字的笔画可以简化为4类:横、竖、左斜和右斜。根据长度不同又可分为长横、短横、长竖和短竖等。本系统将汉字分块,并提取每一块的 笔画特征,就可得到一个关于笔画的矩阵,以此作为特征来识别汉字。而对于数字和字母,它们的个数很有限而且是连通的,可以判断它们弧的有无和位置,并作为 一个很重要的特征来识别。

l 象素分布特征。象素分布特征的提取方法很多,常见的有水平、垂直投影的特征,微结构特征和周边特征等。水平、垂直投影的特征是计算字符图像在水平和垂直方 向上象素值的多少,以此作为特征。微结构法将图像分为几个小块,统计每个小块的象素分布。周边特征则计算从边界到字符的距离。优点是排除了尺寸、方向变化 带来的干扰,缺点是当字符出现笔划融合、断裂、部分缺失时不适用。

l 神经网络方法。就是使用人工神经网络方法实现模式识别。可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题,允许样品有较大的缺损、畸 变,神经网络方法的缺点是其模型在不断丰富完善中,目前能识别的模式类还不够多,神经网络方法允许样品有较大的缺损和畸变,这正是识别存在较大噪声的印刷 体字符的识别所需要的。在车牌识别中数字和字符并不多,所以用神经网络方法实现不必考虑其识别类不够多的问题

2008年7月22日星期二

2008年7月20日星期日

Complete License Plate Recognition Systems

There are several applications where automatic license plate recognition can be used. The term "Complete License Plate Recognition System" does not have a definite meaning out of the context of the specific application.

Different applications may mean rather different License Plate Recognition Systems in terms of layout, hardware and technology, and even for the same applications manufacturers provide LPR systems with similar functionality but quite different structure.

Probably the most common LPR application are parking and access control. In the scope of these applications we can already define a common type of license plate recognition system with a typical hardware configuration and system layout.

As an example of a license plate recognition system, we will introduce here a very simple, still typical LPR system for access control. (Note, that in most cases the LPR system is only a part of an integrated access control system.)

The vehicle approaches the gate of the restricted area it wants to enter into. There is a barrier and a traffic light showing red stopping it. There is an inductive loop installed at the entrance in order to sense the arrival (and the presence) of the vehicle. There is also a CCTV camera mounted to monitor the entrance.

The inductive loop, the camera, the traffic light and the barrier are all connected to a control PC. On the control PC there is an access control application software running coordinating the operation of the access control system.

As the vehicle arrives the inductive loop senses its arrival and gives a signal to the control PC meaning: "car arrived". This signal is processed and understood by the access control application.


Vehicle arrives to the entrance, the inductive loop gives a signal to the control PC

The access control application - via driving a frame grabber card - captures the video signal of the camera and creates a digital picture about the vehicle in the memory (RAM) of the control PC.


Creating digitised picture about the vehicle

Having the digitised picture of the arrived vehicle in RAM, the access control application requests the license plate reader module to analyse the digitised picture and read the license plate number of the vehicle. After reading the license plate number the LPR module returns the read plate number in ASCII to the access control application.


Reading the license plate from the digitised picture of the vehicle

The access control application takes the license number in ASCII and passes it to a database module. The database module checks the plate number against different lists of permissions, etc. and returns an "access permitted" or an "access denied" flag. Based on the flag the access control application opens the barrier and sets the traffic light to green - or not.

Also, the access control application may pass relevant data - like date and time of access - to the database module to store it in an access diary. After the vehicle left the gate (either by passing through or leaving) the system gets ready to start the entire process again for the next arriving vehicle.


Allowing access and storing data in the diary

Keywords: license plate recognition system, license plate reader system, plate recognition access control system, video capture card, frame grabber card, LPR system for access control, LPR application, car plate recognition, vehicle identification system, vehicle recognition, license plate recognition

Vlpr Introduction

vlpr Introduction

It is believed that there are currently more than half a billion cars on the roads worldwide. All those vehicles have their vehicle identification number ("VIN") as their primary identifier. The vehicle identification number is actually a license number which states a legal license to participate in the public traffic.

All vehicle world-wide should have its license number - written on a license plate - mounted onto its body (at least at the back side) and no vehicle without properly mounted, well visible and well readable license plate should run on the roads.



To process, sort or analyse data everyone thinks about using computers. If the data is already in the computer most of these tasks are rather easy to be carried out. It is needless to say that the license number is the most important identification data a computer system should treat when dealing with vehicles.

Suppose a company's security manager would like to have a system that precisely tells at every moment where the cars of the company are: in the garage or out on roads. By registering every single drive-out from and drive-in to the garage, the system could always tell which car is out and which is in. The key issue of this task is that the registration of the movement of the vehicles should be done automatically by the system, otherwise it would require manpower.

Automatic License Plate Recognition does not mean less nor more than the above mentioned automation of data input. Automatic License Plate Recognition replaces, redeems the task of manually typing the plate number of the bypassing vehicle into the computer system.



When talking about License Plate Recognition System people usually understand a computer system that utilises automatic license plate recognition for data input automation.

Strictly speaking License Plate Recognition System is an integrated hardware + software device that reads the vehicles license plate and outputs the license plate number in ASCII - to some data processing system. Again, License Plate Recognition means Automated Data Input where Data equals the registration number of the vehicle.

Keywords: vehicle identification number, vin, license number, licence number, lisense number, license plate lisense plate recognition, vehicle identification automatic license plate recognition, license plate recognition system, vehicles license plate, license plate number, license plate number recognition, automated data input, vehicle registration number recognition

License Plate Recognition Algorithms and Technology

License Plate Recognition Algorithms and Technology

Automatic license plate recognition has two essential technological issues:
· the quality of the license plate recognition software with its applied recognition algorithms, and
· the quality of the image acquisition technology, the camera and the illumination.

The very key factor is the license plate recognition software. The sophistication of the recognition software, the intelligence and quality of the applied license plate recognition algorithms, the mathematical knowledge and the years of experience behind determines the capabilities of the recognition software. The better the algorithms are, the highest the quality of the recognition software is:
· the highest recognition accuracy it has,
· the fastest processing speed it has,
· the most type of plates it can handle,
· the widest range of picture quality it can handle,
· the most tolerant against distortions of input data it is.

In early years of LPR available software were bound to specific countries. One software could read - for example - Spanish plates only, other could read plates from Hong Kong only, etc. This was not accidental: the geometrical structure of the plate as well as its syntax were essential parts of the plate reader software. Without the presumption of a fixed plate geometry (character ratios, character distribution, font type, plate colour, etc.) and a well defined syntax the algorithm may not even found the plate on the picture.


Plate geometry and basic syntax

The most advanced algorithms today read plates without such presumptions. For example, a good algorithm should read all plates from Europe with the same level of quality. There are indeed a wide variety of plate types in Europe:
· black (dark) characters on white (light) plate,
· white characters on black plates,
· one-row plates,
· two-row plates,
· plates with different character-size,
· latin and cyrillic fonts,
· plates with our without region's shield or special mark, etc.


Reading plates of different type is a measure of technology level

If a license plate recognition algorithm can not utilise such additional information like the prior knowledge of the plate structure or plate syntax, it looses a very helpful part of its input data. This loss results in reduction of maybe the most important quality measure, the plate recognition accuracy.

Without using additional information about the plate the remaining part of the recognition algorithm should be significantly better than it was before, when the additional information could be used. Otherwise it would not be possible to gain back the same recognition accuracy.

We believe that there are two key technological parts of a license plate recognition algorithm that basically determines its quality level:
· a robust, very high accuracy and intelligent optical character recognition technology, and
· a technology that allows intelligent structural analysis of complex higher structures.

The robust, very high accuracy Optical Character Recognition (OCR) technology is a very essential requirement.


The OCR task

To get better perception of the nature of recognition accuracy, consider the following example:

Assume the plates have an average of 7 (seven) characters as license plate number. If the overall plate recognition accuracy is required to be above 96%, than the recognition accuracy of the individual characters should be at least 99.5%. Out of 1000 characters not more than 5 could be misread/misrecognised:

(99.5%)7 = 0.9957 = 0.995 · 0.995 · 0.995 · 0.995 · 0.995 · 0.995 · 0.995 = 0.9655 = 96.5%

If someone speaks about 99% overall recognition accuracy, than the recognition rate of the individual characters has to be at least 99.85%.

But the above calculation is only a very simple estimation of the maximum acceptable OCR error rate: it is not the real error rate the OCR can have! The real OCR error rate has to be much lower than the one given by the above estimation, as there are several other parts of the entire algorithm than can make mistake. And the overall recognition accuracy is the multiplication of the accuracy of the individual (and independent) sub-algorithms.

For example, suppose that there are three additional sub-algorithms before the OCR:
· a plate localisation sub-algorithm, responsible for finding the plate on the picture, having 98.7% accuracy,
· a contrast/brightness normalisation sub-algorithm, responsible to equalise the plate picture, having 99.2% accuracy, and
· a character segmentation sub-algorithm, responsible for finding and cutting out the individual characters on the plates and pass them to the OCR, having 99.6% accuracy.
The OCR has a 99.5% recognition accuracy on the individual characters. The overall license plate recognition accuracy is then only 94.2%, as:

0.987 · 0.992 · 0.996 · 0.9957 = 94.2%

The image acquisition technology determines the average image quality the license plate recognition algorithm has to work on. Needless to say that the better the quality of the input images are, the better conditions the license plate recognition algorithm has, and thus the higher license plate recognition accuracy can be expected to be achieved.

What does good image quality mean?

In order to expect reasonable results from a plate recognition algorithm, the processed images should contain a plate
· with reasonable good spatial resolution,
· with reasonable good sharpness,
· with reasonable high contrast,
· under reasonable good lighting conditions,
· in a reasonable good position and angle of view.

Indeed, 'reasonable' is not an exact definition, still it has a well understandable meaning. Here are some problematic images:


Low spatial resolution (too small characters on the plate)

Blurred image

Low contrast

Overexposure



Bad lighting conditions (shadow and strong light)


High distortion

An image acquisition system is considered to be good if it provides a stable, balanced, reasonable good image quality under all of its working conditions. If an LPR system has to work outdoor 24h/day, 7days/week in Middle-Europe, than it has to handle quite a wide range of lighting and weather conditions. Under the chapter Technical and Quality Issues of License Plate Recognition we provide further technical details regarding image quality.

There are some interesting sites where you can find samples of plates all around the World:
· Automobile License Plate Collectors Association
· Eugen Winklharrer collector's page
· Alessandro Libanore collector's page
· PL8S the license plate collectors website

Keywords: license plate recognition algorithm, license plate recognition technology, recognition accuracy, license plate recognition accuracy, LPR technology, car number ocr, car plate ocr, license plate structure, license plate syntax, license plate localisation, license plate localization, character segmentation, contrast brightness normalisation, contrast brightness normalization, license plate recognition

License Plate Recognition Applications

License Plate Recognition Applications

There are several applications where automatic license plate recognition can be used. The two major values license plate recognition adds to systems are automation and security.

After integrating a License Plate Recognition Software Engine into intelligent transportation systems, it becomes possible to automate motorway toll collection, analyse traffic, improve law enforcement, etc.

An Intelligent Transportation System equipped with LPR can provide:
· Flexible and automatic highway toll collection systems
· Analysis of city traffic during peak periods
· Automation of weigh-in-motion systems
· Enhanced vehicle theft prevention
· Effective law enforcement
· Effective enforcement of traffic rules
· · Highest efficiency for border control systems, etc.

Other possible applications include:
· Building a comprehensive database of traffic movement
· Automation and simplicity of airport and harbour logistics
· Security monitoring of roads, checkpoints, etc.
· Vehicle surveillance · Prevention of non-payment at gas stations, drive-in restaurants, etc.

After integrating License Plate Recognition Software Engine into parking management systems, controlled and automatic vehicle entry and exit in car parks or secure zones becomes possible. Furthermore, the ability to recognise registration number is a significant added value for comprehensive parking solutions or inventory management.

A parking lot equipped with LPR can provide:
· Flexible and automatic vehicle entry to and exit from a car park
· Management information about car park usage
· Improved security for both car park operators and car park users
· Improved traffic flow during peak periods

Other possible applications include:
· Vehicle recognition through date and time stamping as well as exact location
· Inventory management · Comprehensive database of traffic movement
At last but not least state border control is one of the most important applications of automatic license plate recognition.

Keywords: flexible and automatic vehicle entry to and exit from a car park, security for both car park operators and car park users, plate recognition access control system, management information about car park usage, traffic flow analysis during peak periods, flexible and automatic highway toll collection systems, analysis of city traffic during peak periods, automation of weigh-in-motion systems, enhanced vehicle theft prevention, effective law enforcement, highest efficiency for border control systems, comprehensive database of traffic movement, automation and simplicity of airport and harbour logistics, security monitoring of roads, checkpoints, prevention of non-payment at gas stations, drive-in restaurants, border control, lpr system for access control, lpr application, car plate recognition, vehicle identification system, vehicle recognition, license plate recognition number plate recognition

2008年7月17日星期四

License Plate Recognition

Terminology
While License Plate Recognition, abbreviated as LPR, and Automatic Number Plate Recognition, abbreviated as ANPR are the most commonly understood terms, there are several other living expressions for LPR, such as: license plate reading, numberplate recognition, car plate recognition, car license recognition, car plate reading, registration number recognition, automatic plate identification, automatic plate reading, optical plate recognition, vehicle plate recognition, car plate OCR, automatic license recognition, automatic licence plate recognition, car number OCR, etc...

2008年7月15日星期二

基于模板匹配和神经网络的车牌字符识别方法

1 引言
车牌识别技术是智能交通系统的重要组成部分的,是集机器视觉、模式识别、人工智能等技术为一体的复杂处理过程。要求识别精度高、处理时间短,能满足实际应 用的需要。目前最常用的车牌字符识别方法是基于神经网络和模板匹配的方法。文献[1-4]给出了基于神经网络的车牌字符识别方法,对于解析度较高(车牌区 宽度不小于120个像素)和图像比较清晰的车牌,这些方法能有效地识别车牌中的字符,但是对于较低解析度和较为模糊的车牌,以上方法是不可行的,因为这些 方法只有在车牌中的每一字符独立分割出来的前提下才能完成识别工作,而独立分割车牌区的字符,对较低解析度和较为模糊的车牌来说是非常困难甚至是不可能 的。文献[5]提出了一种基于模板匹配的车牌识别方法,只需提取字符区整体特征,避免了字符的分割,能有效地完成低解析度和模糊的车牌字符识别,但字符识 别时间太长。本文提出了一种改进的神经网络和一种四灰度加权相关函数模板匹配集成方法来进行字符识别,使车牌字符识别的精度和实时性得到了改善。

2 模板匹配字符识别方法
中国车牌的字符分成4类,即汉字、字母、数字和点号(“l”)。汉字为各省或直辖市的简称或军种的简称。字母为a~z英文字母。数字为0~9。

标准模板匹配法识别车牌字符之前,对已定位好的车牌区需进行标准化,标准化的目的是使车牌区的字符和标准模板的匹配特征相适应。通常取标准模板为二值化图 像模板(取车牌区字符为1像素,背景为0像素),同时车牌标准化后得到的车牌图像也为二值图像。匹配是以距离或相似函数作为依据的。本文提出的基于四灰度 的加权相似函数的判别准则,既可保证字符识别的精度和稳定性,又具有满意的识别速度。

四灰度是将模板和车牌标准化为a,b,c,d 四种灰度值的图像。通过对实际采集的车牌灰度图像进行分析发现:字符的灰度值a、背景的灰度值b、背景和字符之间的边界灰度值(分字符的边界靠字符处的灰 度值c、背景的边界靠背景处的灰度值两类d)之间有较明显的界限。取模板的大小为m×n像素(如8×16,8为模板的列数,16为模板的行数),则模板和 用于匹配的车牌中对应区域的像素的灰度值可用gm×n和fm×n矩阵表示,同时,定义模板和匹配车牌区之间的相似矩阵为
sm×n,这3个矩阵分别为



运 算的值实际上是加权值,sm×n函数实际上是一个模板和所处理的对应车牌区像素之间的相似程度的加权和。事 实上,加权值合理地反映了字符、背景、字符边界和背景边界位置之间的联系。实验表明:这种加权相似函数法与交叉相关函数法相比具有同样的匹配正确率,且运 算量不到交叉相关函数法的0.1%。

中国车牌的字符模板分为汉字、英文字母和数字模板,由统计方法构造这些模板并保存到数据库中[3]。模板匹配是将字符模板和标准化了的车牌区字符进行匹配来识别字符。

匹配步骤如下:
(1) 步骤1: 根据不同车牌类型的字符组合先后顺序(如小型汽车的顺序为汉字-0或英文字母-英文字母或数字)取字符模板。

(2) 步骤2: 依次取汉字模板进行匹配,模板在车牌字符区上左右滑动(滑动的目的是为了找到最好的匹配位置)。模板以车牌字符区最左边为起点,向左和向右分别滑动几个像 素(取2~3个像素),计算每个位置每个汉字模板的m值,取最大的m值对应的模板为最匹配的模板。若m值大于阈值t,则可确定为所识别的汉字,否则拒绝识 别汉字。此时得到了最佳匹配时模板在车牌字符区中的右边界位置s1。

(3) 步骤3:依次取英文字母,以s1为起点,进行类似步骤2的计算找到最匹配的模板,并进行识别。同时得到新的模板在车牌字符区中的右边界位置,更新s1。

(4) 步骤4: 取全部英文字母和数字,以s1为起点(有分隔符的地方再加分隔符的宽度w)进行类似步骤3的计算,重复至7个字符全部识别完成。

实验表明:对汉字的识别阈值t值取85%,对英文字母和数字阈值t值取80%可得到最好的匹配效果。对同一车牌的字符识别四灰度加权相似函数法识别率和文 献[5]采用的交叉相关函数法识别率相近,但识别时间不到文献[5]采用的交叉相关函数法的5%;四灰度加权相似函数法识别率比二值图为基础的模板匹配法 至少高15%,而识别时间基本相同。

3 神经网络字符识别
本文采用三层神经网络对字符进行识别,并针对车牌图像的特点,对传统的bp算法进行了改进。实验表明,改进后的神经网络可以提高识别率1%-3%,提高网络的收敛速度30%-50%。

3.1 改进误差函数
本文采用lee(最小指数误差)误差函数算法,可有效地提高神经网络的性能。lee误差函数为

式中e为lse 函数。采用lee误差函数可以加快网络的学习收敛速度,避免收敛过程出现振荡现象。

3.2 改进样本学习规则
传统的bp学习算法是一种随机梯度最小均方算法,每次迭代的梯度值受样本中噪声干扰的影响较大,所以有必要使用批处理方法将多个样本的梯度进行平均以得到 梯度的估值.但是,在训练模式样本数很大的情况下,这种方法势必增加每次迭代的计算量,并且这种平均作用将会忽略训练样本个体的差异性,降低学习的灵敏 度。因此,本文的做法是将所有训练模式样本分成若干个子块分别进行平均学习,当误差收敛到一预定数值时,再以此刻权值为初值,转入下一子块进行学习,在所 有的子块被训练完后,若最后的误差达到预定的精度,则学习完毕,否则将转入下一个循环继续学习,直到满足识别精度的要求。

3.3 采用分组神经网络
根据车牌类型和字符类型将神经网络分成3个子网学习。这3个子网分别是汉字子网、数字和英文字母子网。各子网中的节点数可根据不同的特点来设置。分组子网可以降低网络的复杂性,提高网络的识别率。

4 结束语
由于车牌采集的条件(场景、几何位置、灯光、天气、车辆速度和摄象机的解析度等)不同,由定位得到的车牌中的字符有的可以独立分割出来、有的可以部分分割 出来、有的则不能分割出来。对于不能独立分割出来的车牌字符,只能采用模板匹配的方法进行识别;而对于可将字符切分出来的车牌,可用模板匹配和神经网络的 方法,但这两种方法识别的效果不一样。

对能对立分割出来的车牌字符,选择识别方法可根据实际系统要求确定。如:对于识别率要求高的系统(如在高速公路收费系统中应用的车牌识别系统),应选择神 经网络方法;对实时性要求较高的实际系统(如在车流量较大的城市道路或流量观测站中),应选择模板匹配方法;对用于统计各种车辆,只需要识别汉字的场合应 选择模板匹配方法。
采用用本文提出的方法,对从实际交通场景中获取的大量车牌图像进行识别,识别率超过92%,识别时间不超过1200ms,能较好地满足实际系统的要求。

参考文献
[1] fahmy m. m. m., computer vision application to automatic number-plate recognition. proceeding of 26th[d]. international symposium on automotive technology and automation, aachen, germany, 1993: 625-633.
[2] 刘效静,成 瑜. 汽车牌照自动识别技术研究[j]. 南京航空航天大学学报, 1998,30(5): 573-576.
[3] 赵雪春,戚飞虎. 基于彩色分割的车牌自动识别技术[j]. 上海交通大学学报,1998,32(10): 4-9.
[4] john setchell. applications of computer vision to road-traffic monitoring. ph.d thesis. university of bristol[j]. england,1997: 66-81.
[5] m.notturmo granieri, f.stabile, p.comelli. recognition of motor vechicle license plates in rear-view images. image technology. jorge l.c.san2 coordinated sience laboratory univerity of illineis at urbana. usa,1993: 231-252.

作者简介
王 敏 女 教授 主要研究方向为图像处理和模式识别技术及人工神经网络。

2008年7月14日星期一

什么是车牌自动识别产品?

车牌自动识别产品,简称车牌识别,就是能直接识别出车辆牌照的计算机装置,识别结果包括车辆牌照的全部汉字、字母、数字、颜色、牌照坐标、牌照图像等

广义来说,车辆自动识别技术有三类:定位技术,如GPSGPRS3G等;电子标签,如非接触IC卡之类;车辆牌照自动识别,如利普视觉的车辆牌照自动识别软件模块

前两类技术,是在确定车辆其他相关信息之后才能得到车辆牌照信息,而且需要被检测车辆主动参与:事先在车辆上加装置,并建立了后台管理,因而管理范围有限、扩容方式复杂;优点则是准确

车牌自动识别产品,则是先识别出车辆牌照,不需要被识别车辆主动参与,可以对所有通行车辆识别、管理

车牌识别所需的图片要求

利普视觉
车牌识别所需的图片要求,BMP格式,准备进行识别的图像的分辨率必须为一下三种中的任意一种:帧格式:768*576、场格式:768*288、1/2帧格式:384*288。(以上图像大小单位以PAL制式为例均为像素,并且图像宽度均应为4的整数倍)
识别所需的图片要求:
1. 用来识别的图像必须为BMP格式。
2.准备进行识别的图像的分辨率必须为一下三种中的任意一种:帧格式:768*576、场格式:768*288、1/2帧格式:384*288。(以上图像大小单位以PAL制式为例均为像素,并且图像宽度均应为4的整数倍)
3.采集到的图像必须为24位真彩色图像。
4.如果选择帧格式图片进行识别,图片最小不能小于640*480。
5. 抓拍到的图片,车辆牌照在图片中的宽度所占整幅图的比例必须在1/4到1/6之间。
6.抓拍到的图片上的车辆牌照信息最起码要保证人的肉眼能够看清,否则很难识别

2008年7月12日星期六

汽车牌照自动识别技术初探

汽车牌照自动识别技术初探
2003-09-26  中国公路网  天津市管道工程集团有限公司 吴强,天津师范大学 刘露

  80年代以来,随着我国国民经济的迅速发展,机动车辆规模及流量大幅度增加,全国机动车量年均增长15%以上,城市通路里程年均增长7.9%,高速公路和城市交通管理现代化水平的提高势在必行,迫切需要采用高科技手段来充实和加强交通管理水平。

  作为收费系统的主要目的是在保证车辆通行的前提下,最大限度的减少通行费的流失,而现有高速公路收费系统中由于没有车牌号管理,或是有此管理但 仅单靠收费员人工输牌照号,所以依然存在着各种各样的倒卡、换卡以及收费员营私舞弊现象,甚至在某些地方已经形成倒卡团伙。因此在已建成的收费系统或新建 的收费系统中加入车牌自动识别,不仅可以减轻收费员的劳动强度,更可彻底解决现有收费系统中存在的漏洞,为业主减少通行费的流失,随着联网收费的推广应 用,车牌识别技术将会为公路收费管理带来极大的便利。

车牌识别技术

  汽车牌照识别技术(License Plate Recognition, LPR,简称“车牌通”)是一个特定目标为对象的专用计算机视觉系统, 该系统能从一幅图像中自动提取车牌图像,自动分割字符,进而对字符进行识别,它运用模式识别、人工智能技术,对采集到的汽车图像进行的方法,能够实时准确 地自动识别出车牌的数字、字母及汉字字符,并以计算机可直接运行的数据形式给出识别结果,使得车辆的电脑化监控和管理成为现实。 车牌定位、字符切分,并运用独创的基于二值特征的识别算法和基于灰度特征的识别算法相结合,是ITS的一个重要组成部分,它的成功开发必将大大加速ITS 的进程。

  一、车辆牌照基本元素

  我国机动车使用的牌照主要是根据公安部一九九二年颁布的《中华人民共和国机动车号牌》标准(GA36-92)制作的。此外部队、武警等部门的汽车牌照也有自己的标准,但是无论哪种汽车牌照都由下列基本元素组成:

  1、汉字(牌照中包括的汉字大约60个)、
  2、英文字母(A-Z)
  3、数字(0-9)
  4、颜色(蓝、黄、白、黑)

  二、车辆牌照识别设备包括

  触发单元、抓拍单元、处理单元

  三、车辆牌照识别的优点

  1、高速:把以不高于时速120Km的汽车车牌号码自动识别出来的时间≤0.8秒,并将车牌号数据实时传送至车辆管理中心。

  2、高识别率:采用相关的演算当作基本技术的独特算法,无论半天或夜间都能够保持较高的自动识别率。

  3、小型廉价:采用了一个160mm×100mm的一个板卡即可完成一个车道的所有识别的处理。

  4、软硬结合,独立工作:系统自动完成牌照的识别成像、照明、识别三个过程。

  5、智能补光:自动开启闪光灯,调节闪光灯强弱,达到最佳照明效果。

  6、元素识别齐全:对颜色、汉字、字母、数字的每个元素识别率较高。

  7、全天候工作:解决影响牌照识别率的气候、环境、灯光等因素。

  四、车牌识别需解决的技术难点

  1、算法难点:汽车牌照区域定位、变形校正、旋转校正、污损修复、字符切分、字符识别

  2、成像环节难点:环境光影响(太阳定向反射、镜面反射)、车辆高速运动中成像

  3、系统运行难点:全天候连续工作、系统无故障时间

车牌识别技术的组成及原理

  一、系统组成:

  汽车牌照自动识别系统由车体感应器、彩色摄像机、辅助光源、图像采集预处理器、主控电脑和识别系统软件组成。

  二、系统原理:

  本系统的原理框图如下所示,主要工作流程是:当车辆通过关卡,经过车体位置传感器的敏感区域时,传感器发送一个信号给图像采集控制部分。采集控 制部分首先由控制采集卡采集一幅汽车图像送至图像预处理模块,然后再由预处理模块对输入图像进行处理后送入电脑。电脑内的软件模块从输入图像中找到牌照的 位置,对牌照作字符切分,得到各个字符的点阵数据。字符识别模块从点阵数据中提取字符数据,与模板库进行匹配,以OCX控件的方式给出识别结果。应用系统 调用这个结果组建数据库后,就可以根据具体需要编制各种不同类型的管理程序,从而达到管理的目的。

车牌识别技术实现的功能

  一、防止不同车辆之间换卡:通过在出口处核查通行卡上的车牌号卡实现。

  二、防止同一车辆进行倒卡(走长缴短):通过严格的时限检查发现可能有问题的车辆,在中心数据库中搜寻此车的真正入口。如和卡上的入口不符,则为同车倒卡。

  三、防止卡流失:通行卡上必须写有车牌号,这可以彻底杜绝收费员通过模拟过车等方式得到通行卡。另外在中心数据库中对应了卡号和车牌号,即使闯关出去的车辆也可以找到它的入口卡号和车牌号,并可通过公安进行追查。

  四、防止收费员利用车类或降档车型进行营私舞弊:通过车牌号和免费车库的比较来确定免费车,通过车牌颜色来辅助核查分型结果,可以发现收费员在其中是否有营私舞弊行为。

  五、自动放行,提高通行能力,减少通行卡投资:对于免费车和月票车,通过车牌号和数据库中免费车库和月票车库的比较,可实现公务车、军警车、特殊车、月票车的不发卡自动放行。

  六、稽查黑名单车:通过车牌号和黑名单库比较,可发现各类黑名单车。

  七、车辆管理统计:可实现某一辆车、某单位车、某地区车的通行情况分类统计。

  八、辅助车型分类:通过车牌号对应出车的车型,可对收费员的分型进行核查。

车牌识别技术的应用

  一、完善的车牌识别系统包括:

  1、极高的识别效率
  2、完全开放的应用平台
  3、系统构成简单,安装维护方便
  4、系统可靠性高,能够满足各种使用条件
  5、系统稳定性高,一旦崩溃恢复要快
  6、功能完备,应用软件丰富
  7、适宜的性价比

  二、车牌识别系统采用的技术:

  目前国内外汽车牌自动识别技术主要采用软件方式及软硬件结合方式两种技术方案。

  ——软件方式

  就是通过识别软件对普通的车辆图像进行牌照识别,它的最大特点就是成本低,通用性好。

  ——软硬件结合方式

  就是首先通过专用的图像抓拍设备获取一幅适合于计算机识别汽车牌照的高质量图像,然后用软件、硬件结合的方式对所获取的专用图像进行牌照识别,它的特点是识别率高,能够全天候工作。其中包括以下核心技术:

  一、车牌定位技术

  采用独特的车牌定位算法,在各种不同的光照背景下均能很好地定位出车牌(车牌定位正确率>99%),大大增强了系统的适应性,为进行车牌图像匹配奠定了良好的基础。

  二、光学字符识别技术(OCR)

  采用识别车牌字符的OCR技术以通用OCR算法为基础,并针对车牌字符特征进行了优化,具有很高的性能(车牌字符识别率>98%)。

  三、车牌图像匹配技术

  把图像匹配技术应用于智能交通领域。运用专用的图像匹配算法,具有准确的匹配性能和极快的匹配速度(车牌匹配正确率>98%)。

  其次,为了获得质量出众的采集图像,采用光照不足时还可自动开启补光照明,保证了拍摄图片的质量。

  四、车牌识别系统应用的领域:

  1、高速公路收费管理系统在收费入、出口分别完成车牌号码识别和车牌匹配工作,当车辆经过出口时,系统识别车牌并调出车辆的入口资料,自动计算 出应缴纳的金额,起到了防止内部人员作弊的作用。此项功能针对纳入"黑名单" 的车辆,如:冲关后或肇事后逃逸的车辆、被公安部门通缉或挂失的车辆、欠交费的车辆等。只要将其车牌资料输入系统中,系统就会处于自动检测状态,24小时 不停地对所有经过车辆自动进行识别、比较、处理;一旦发现上述车辆经过,立刻给出控制信号驱动报警装置和拦截装置,进入报警拦截状态,也可向110控制中 心传送报警信号,达到车辆自动稽查的目的。通常用于交通监控卡口、路桥收费卡口、停车场入口等。除了作为社会治安的一个环节为社会服务外,还可直接为企业 服务,产生经济效益。其效益表现为处以罚款或补交费用。

  车辆的自动放行,如特种车辆(军车、警车)、预交费车辆(如已办理月、年缴费卡的车辆)以及其他授权免费通行的车辆。系统处于自动检测状态的过 程与上述情况相同。所不同的是,一旦发现该类车辆经过,给出的控制信号不是驱动拦截装置,而是驱动放行装置。此时系统会自动开启道闸,达到车辆不停车过卡 和减少工作人员劳动强度、严化内部管理的目的。通常用于路桥收费卡口专用车道、停车场的收费口以及大型单位出入口。

  其作用是可以解决车流高峰期的堵塞问题和减少运作费用,维护业主利益。

   2、高速公路超速自动化监管系统的应用,以车牌识别技术为核心技术,辅助其他高科技手段,建立高速公路超速无人值守的自动监测、自动布控系统是解决高速公路上因超速造成交通事故的有效手段。

  3、公路布控采用车牌识别技术,实现对重点车辆的自动识别、快速报警处理。不仅可以有效防止机动车辆被盗,而且为公安、监察机关对犯罪嫌疑人所驾驶的车辆自动监控、跟踪提供了高科技手段。

  4、能对已保存的图像文件进行集中识别处理,大大减少劳动强度,大幅度提高处理速度和效率。这一功能通常用于电子警察系统、道路监控系统。

  5、防套牌、车辆自动跟踪:利用车辆信息网上的实时信息,以同一车牌出现时的方位、距离、时间等参数,快速计算处理,自动查出该车牌是否属于套牌车。同样也可利用网上信息查悉指定车辆的行踪。

  6、自动扣费,电子钱包缴费全国通用:自动扣款收费,一方面能实现不停车收费,解决卡口车流瓶颈问题;另一方面又能杜绝人与现金的接触,解决与 现金有关的种种问题。该系统与其他相关的系统的有机结合可方便应用于各类封闭式和开放式路桥卡口自动收费系统,根据联网规模的不同,适用于IC卡、金路 卡、虚拟储值卡以及金融卡等各种自动扣费方式,可从路段扩展到区域、地区、跨地区以至全国路网。 

  智能交通系统(ITS)在我国尚属起步阶段,车牌识别技术在ITS系统中占有重要位置。车牌识别技术的推广普及,必将对加强高速公路、城市道路管理,减少交通事故、车辆被盗案件的发生,保障社会稳定等方面产生重大而深远的影响。

车牌识别系统

机动车闯红灯是日常交通管理中常见的交通违章现象,不仅扰乱了正常的交通秩序,也是造成机动车交通事故的主要原因之一。“电子警察”就是针对机动车路口闯 红灯这种极易造成恶性事故的交通违章现象进行自动监测记录,做到了无人值守,不间断监测,证据充分正确。
车 牌识别技术(Vehicle License Plate Recognition,VLPR)是计算机视觉和模式识别技术在现代智能交通系统中的一项重要研究课题,是实现交通管理智能化的重要环节。它是以数字图 像处理、模式识别、计算机视觉等技术为基础的智能识别系统,它利用每一个汽车都有唯一的车牌号码,通过摄像机所拍摄的车辆图像进行车牌号码的识别。在不影 响汽车状态的情况下,计算机自动完成车牌的识别,从而可降低交通管理工作复杂度。车牌自动识别技术在车辆过路、过桥全自动不停车收费,交通流量控制指标的 测量,车辆自动识别,高速公路上的事故自动测报,不停车检查,车辆定位,汽车防盗,稽查和追踪车辆违规、违法行为,维护交通安全和城市治安,防止交通堵 塞,提高收费路桥的服务速度,缓解交通紧张状况等方面将会起到积极的作用。
针对以往车牌识别算法的缺点和不足,例如识别率低、识别速度慢、车牌定位不准确等,本文提出了一种新的基于小波分析的改进车牌定位算法,同时将引入动量因子的BP神经网络应用到字符识别,加快了网络的训练过程。

2 基于小波变换和神经网络的车牌识别技术总体设计
2.1 车牌定位算法的基本思路

在 某一个相位的红灯周期内,如果检测到有车辆通过,触发视频采集模块采集前端摄像机传送来的视频流,进行图像采集,采集到的图像是24位的真彩色图像,首先 将图像进行灰度变换,转换为256色的灰度图。在车牌区域的局部图像内,字符笔画与车牌背景间的亮度反差形成明显而密集的边缘,上升缘与下降缘交替出现。 利用车牌区域的这一高频特征,采用小波分析的多分辨率思想,进行水平方向上的小波变换,小波变换后的高频部分可以突出车牌区域,后继处理只需要对高频图像 进行变换,即可定位出车牌。采用这种方法可以将运算量减少一半,大大缩短了车牌定位的时间。
接下来,利用局部阈值方法,将高频图像部分二值化。此 时的图像可能含有一些干扰信息,因此要先对其进行中值滤波,以消除一些不必要的噪声。考虑到数学形态学的腐蚀和膨胀运算可以分别起到突出轮廓和填充空洞的 作用,因此利用数学形态学的闭运算来突出车牌的轮廓和消除孤立的部分。然后根据对车牌的先验知识(例如长宽比在一定范围内等)提取车牌的候选区。最后,将 车牌候选区域变换到HSI色彩空间,通过判断背景的颜色来确定准确的车牌区域。该算法的流程图表示见图1:

图1 车牌定位算法


2.2 字符识别算法的基本思路
首 先,将已经确定的车牌区域变换成灰度图。利用中值滤波进行预处理,然后利用中值滤波消除牌照上的污点,利用HOUGH变换对车牌进行倾斜度矫正。接着采用 自适应阈值法,将图像二值化。利用竖直方向的投影具有波峰、波谷间隔出现的特性,将字符进行分割。最后,将分割的字符大小归一化后,送入改进的BP神经网 络进行字符识别。改进的BP神经网络采用了动量因子,实验表明采用该方法大大缩短了网络的训练时间。字符识别流程图如图2所示:

图2 字符识别算法


3 车牌定位中小波变换的运用
本方案使用Mallat一维分解算法实现图像的小波分解。假设2j=W,即现在的图像分辨率为j,则待变换的图像表示为fj(n),则离散函数fj(n)的小波分解为:fj(n)=wj-1-fj-1 其中, 。上式的分解中,Wj-1代表了图像的变化比较明显的部分,即图像的高频部分。而fj(n)代表图像所包含的基本信息,即图像的低频部分。将图像分解为低频和高频部分后,车牌字符、边缘等变化比较明显的部分就包含在一维小波分解后的高频图像部分中了。水平方向小波分解的程序流程图见图3所示。

图3 小波变换流程图


图4为图像的一维水平和竖直方向上的小波变换(增加对比度后的效果)。

图4 小波变换


由图4可以得出,小波变换低频系数图像保持了原图像轮廓的主要信息,而高频图像反应了原图在不同方向上的细节信息。
分 析小波高频图像二值化后的水平投影图可以得到:尖峰的宽度即为车牌上下方向的大致坐标。从竖直投影图可以看出,变化平缓的部分为车牌左右方向的大致坐标。 但图像中存在的噪声对准确识别车牌位置仍然有很大的干扰,但干扰噪声明显比采用边缘检测算法要少的多,更重要的是只需要对高频图像进行检测,运算时间缩减 了一半,只需要扫描半幅图像。

4 字符识别中改进BP神经网络的运用
4.1 字符识别总体设计

车牌的第一个字符为汉字,第二为英文字母,第三个字符为英文或阿拉伯数字,第四至第七个字符为阿拉伯数字,同时考虑到过于复杂的神经网络结构会增加网络训练时间,同时计算量也会增大,所以采用四种不同结构的BP神经网络分别进行识别。字符识别的过程如图5所示:

图5 字符识别原理


4.2 BP神经网络的设计
(1) 网络种类以及网络层数的确定
神 经网络的许多特性正是由于隐含层的存在才具备的。然而,具体取多少隐含层合适至今为止却没有确定的规律可循,不同的应用对象,与其相适应的网络结构差别很 大。本文中采用具有一个隐含层的三层BP神经网络。考虑到BP神经网络训练速度慢,容易陷入局部最小,这里采用加入动量因子的改进BP算法来构造汉字神经 网络。
(2) 传递函数的确定
由于BP网络的非线性逼近能力是通过S型传递函数体现出来的,所以隐含层一般采用S型传递函数,输出层的传 递函数可以采用线性或S型传递函数。当希望网络的输出范围无限制时,应当使用线性传递函数。当用S型传递函数作为输出层的传递函数时,其非线性逼近速度快 于线性传递函数,但此时的网络输出被限制在(0,1)或(-1,l)。在我们设计的神经网络汉字识别器中,为了减少神经网络输出层的神经无数,我们采用二 进制编码来作为输出的目标向量。故我们在输出层采用对数S型传递函数,以限制输出范围在[0,1]范围内。
(3) 输入层个数的确定
输入 层个数根据待识别字符所抽取的特征向量维数大小来确定。考虑到速度和精度双重因素,因此特征向量维数不能太高。过低的维数将无法描述汉字之间的差异,较高 的维数则对于待识别图像的微小偏移比较敏感。在本系统中,特征提取采用的是基于投影图和轮廓提取的方法进行的,网络的输入层个数应取为:96个,即为竖直 投影图的像素个数加上水平投影图的像素个数。
(4) 输出层神经元个数的确定
在系统中,神经网络输出层神经元个数是依据所需要识别的字符 数目来确定的。此外,为减少输出层神经元数,我们采用二进制编码来作为输出的目标向量。举例而言,在车牌的汉字只有30多个,那么把30多个汉字进行二进 制编码,最少需要5位,如00000,00001,00010等等,故共需要5个输出端,其目标向量即为上述的二进制的编码值。对于字母数字神经网络,需 要识别的字符个数有36个,把这36个字符进行二进制编码至少需要6位,因此字母数字神经网络的输出层神经元的个数是6个。但是,我们所选取的神经网络的 激励函数为S型的函数,其图形如图6所示:

图6 Sigmod 函数


由于在无穷远处才能取得极值,这里的编码取为0.1和0.9来分别表示0和1。例如鲁的编码为:[0.1, 0.1, 0.1 ,0.1, 0.1]。
(5) 隐含层神经元个数的确定
神经网络隐含层的神经元个数过少,会导致训练时间过长,迭代次数多,权值来回调整,不易稳定。隐含层神经元个数过少,会增加网络的学习时间,网络所需要的存储容量也变大。因此,综合以上几点,汉字神经网络隐含层神经元的个数选取为18个。
(6) 初始值的选取
由 于神经网络系统是非线性的,故网络初始权值对于学习是否达到局部最小、是否能够收敛以及训练时间的长短的关系很大。如果初始值太大,使得加权后的输入落在 S型传递函数的饱和区,从而导致其导数 f'(x)非常小,而在计算权值修正公式中,因,当f'(x)~0时,则有δ~0,这使得Δδ~0,从而使得调节过程几乎停顿下来。所以,一般总是希望经 过初始加权后的每个神经元的输出值部接近于零,这样可以保证每个神经元的权值都能够在它们的S型传递函数变化最大之处进行调节。所以一般取初始权值在 (-1,l)之间的随机数,而且要求数值比较小,这样可以保证每个神经元在一开始就处在它们传递函数变化最大的地方。
在对系统进行仿真测试时,使用时间作为种子,来产生随机的初始值。函数srand((unsigned)(time(NULL)));Wij= (double)(rand())/(32767/2) -1用来产生在[-1,1]内的初始值。
(7) 学习速率的选取
学 习速率决定每一次循环训练中所产生的权值变化量。大的学习速率可能导致系统的不稳定;但小的学习速率将导致较长的训练时问,可能收敛很慢,不过能保证网络 的误差值不跳出误差表面的低谷而最终趋于最小误差值。所以在一般情况下,倾向于选取较小的学习速率以保证系统的稳定性。学习速率的选取范围一般在 [0.01~0.8]之间。这里的学习速率选取为0.4。
(8) 动量因子的选取
动量因子的引入可使网络权值的变化不仅反映误差曲面局部的梯度信息,而且反映了误差曲面最近的变化趋势。其实质是将最后一次权值变化的影响,通过一个动量因子来传递。引入动量因子可以平滑误差曲面梯度方向剧烈变化的作用,从而在一定程度上解决了局部最小值的问题。
(9) 总结
将前面所确定的各个参数进行总结。
(10) 神经网络的训练
设计完神经网络的结构之后,接下来就需要对网络进行训练。
图7中曲线2所示为采用动量因子的汉字神经网络训练误差曲线图,曲线1所示为采用一般的BP神经网络的汉字神经网络训练误差曲线图。可以明显看出,改进的BP算法比一般的BP网络收敛更快,大大缩短了网络训练所使用的时间。

图7 误差曲线图


4.3 字符识别测试结果
为了验证所设计的神经网络的有效性,测试集选取了300幅图片进行了实际测试,表1列出了各个神经网络识别的一些参数。
表1 四种网络训练参数表

点击看原图

实 验结果表明,汉字识别网络对于光照条件和清晰度较好的汉字基本能够识别出来,具有较强的容错能力和学习能力。同普通的BP神经网络相比,网络收敛速度更 快,可以有效地提高系统的抗干扰性和识别率。字母数字网络能够识别大部分牌照,但对于一些污染严重、光照条件弱的车牌无法进行准确识别。

5 结束语
基于小波的车牌定位算法,可以较好的进行车牌定位,定位率可以达到95%以上。在光照条件较好的情况下,对字符的识别率可以达到80%以上,对于光照条件较差的图片,识别率相对较差一些。本文选取了300幅图片进行了实际的测试,测试的结果如表2所示。

表2 字符识别测试结果

点击看原图


实际的工程测试表明所用的算法在保证系统运行稳定的情况下,可以快速、比较准确的进行车牌的定位。

2008年7月6日星期日

车牌识别系统

车牌识别系统

l 系统特点:
1
、本管理系统最大的特点就是全自动化。由于系统采用了视通汽车身份识别技术,在入场登录、计费、自动放行、自动报警、内部管理等方面,完全避免了人工介入的情况,是真正的电脑操作、真正的自动化。可解决出入口堵车问题和工作人员作弊问题。
2
、另一个特点就是强大的查询功能和报表功能。因为能够确定车辆的身份及进出时间,所以能为事件后的调查提供极其有用的帮助(模糊查询)和为管理者提供详尽的报表。可解决查询需求多样性的问题。
3
、第三个特点是安全性能好。能够对出入车辆进行自动检测,确定出入车辆的身份及车辆出入的时间,保证出入车辆的符合性,在发生异常情况时自动报警,对停车场停留车辆有足够的措施来保障其安全。基本上解决了车辆的保安问题。
4
、第四个特点是内部车辆管理电脑化。利用内部车辆出勤一览表,可以实时准确掌握内部的车辆情况,便于车辆调度。可解决车辆调度难的问题。

与电子标签身份证系统相比,本系统有如下特点:
一、通用性强。因为本系统最大的特点就是采用了视通汽车牌照识别技术,是以汽车牌照作为识别的依据,所以无论是装有电子标签的车辆也好,或是没有安装电子标签的车辆也好,都能进行处理。
费用低。与利用电子标签识别的系统相比,造价只有其三分之一左右,而且省去了电子标签的安装设备及电子标签的维护费用,在运作期间还可节省人力(卡口无人值守)。
二、安装容易。本系统的安装,与通常的收费管理系统安装无异。而电子标签系统的安装,除了接收系统的安装外,还有车辆的电子标签安装,需要场地和设施。
三、维护保养方便。使用的是通用设备如摄像头、地磁线圈、电脑等,容易维护保养,而且只有自身系统的维护保养。不象电子标签系统那样除了须对检测系统维护保养外,还须对车辆端的电子标签进行维护保养。
四、消费者容易接受。首先对法定免费车辆没有任何附加的动作,而对预交费车辆来说,除了需要预交费和登记之外,也不需要其他的动作,既不需要因安装电子标签而增加额外的费用,也不会因安装电子标签而影响车辆的美观。

l 系统组成:
系统共有如下七部分组成:
一、网络系统
由内部铺设的同轴电缆、路由器、集线器等组成。主要的作用是连接各车道、各车道与中心监控室,完成信息的传递。
二、 车辆身份自动识别系统
视通汽车身份自动识别系统组成,即由汽车牌照识别系统和汽车类型识别系统组成。主要有车体感应器、摄像机、辅助光源、激光收发器、图像采集处理器等部件。主要的作用是完成对车辆的身份识别,在计费软件的控制下,实现自动登录、自动计费功能。按车道安装。
三、 车道限放行系统
由车体感应器、道闸、栏杆控制器、信号灯组成,设有受控的外部接口,在管理软件的控制下,对来往车辆的放行与否起提示作用以及对限行车辆起限制作用,实现自动放行功能。按车道安装。
四、人工收费系统
由收费操作台、收费显示牌组成,在管理软件的控制下,显示车辆的身份(牌照及车形)、出入口站名、应收费金额,打印收款凭证,放行已交费车辆,实现人工收费功能。须由专人操作。按收费车道安装。
五、自动扣费系统
由预交费的IC卡或银行信用卡收费器、收费显示牌组成,作用与人工收费系统相同,只是无人操作,全由机器按指令自动控制,实现自动扣费功能。这里的IC卡收费器相当于人工收费的操作台,IC卡相当于人工收费的现金。按自动扣费车道安装。
预交费的IC卡有使用的局限性,即只能在某些停车场使用,不能通用;而银行信用卡虽然可以通用,但又有交易时间长的问题。如何选用自动扣费系统,需根据实际要求而定。
六、中心监控系统
由摄像机、辅助光源、画面分割器、显示 器、不间断电源、控制台组成(图像捕捉部分与自动计费系统的图像捕捉部分可以兼容),在管理软件的控制下,主要作用是对停车场的运行状况进行存储和监视, 对系统突发事件的处理以及对停车场的车辆信息进行统计并编制报表,实现中心监控功能。只在中心监控室安装。
七、系统软件
整个系统软件分为车辆识别软件、自动计费软件、管理软件、自动扣费软件四大部分。
车辆识别软件的功能就是在出入口捕获车辆图像、对车辆身份进行识别,送出识别结果。
自动计费软件的功能就是根据车辆识别软件送出的结果,组建整个系统共享的数据库,并据此计算出场车辆应缴停车费。
管理软件的功能就是利用系统共享的数据库,按照自动计费软件的结果,决定除计费以外的所有功能,如车辆的放行、报警、模糊查询、统计报表、用户设定等功能。
自动扣费软件的功能就是在接收了应扣金额的信息后,自动扣除帐上金额。

l 系统示意:

l 应用领域:

公路收费、停车场管理、道路监控


2008年7月5日星期六

国内外车辆牌照识别技术综述

1.1 国内外车辆牌照识别技术综述

从上世纪80年代,欧美等发达国家率先开始了车牌照识别方面的研究工作。由于受当时的硬件处理条件所限处理器运算速度慢,存储器容量低,车牌照识别系统的研究工作仅限于一些低速,要求较低的场合,例如停车场管理,停车交费等场合。随着人们生活水平的提高,智能交通系统研究和应用的不断深入,对车牌照识别系统的性能的要求也越来越高,早期的产品已经不能满足现今社会的需要。

随着硬件技术的不断发展,发达国家的车牌自动识别系统在实际交通系统中已取得了成功的应用。而我国在车牌自动识别系统方面的开发和应用还处在起步阶段,主要原因是识别速度这一瓶颈问题限制了应用和推广。

车牌照系统主要分为图像采集,图像处理,车牌定位,字符切分,字符识别几个部分[4][5]

Figure 1-2 Chinese VLPR model

图像采集:目前图像采集主要采用专用摄像机连接图像采集卡或者直接连接便携式笔记本进行实时图像采集,将模拟信号转换为数字信号。

图像处理:需对采集的图像进行增强、恢复、变换等处理,目的是突出车牌的主要特征,以便更好地提取车牌区域。

车 牌定位:从人眼视觉的角度出发,并根据车牌的字符目标区域的特点,在二值化图像的基础上提取相应的特征。车牌定位是车辆牌照自动识别系统中的关键和难点, 实际图像中的噪声、复杂的背景等干扰都会使定位十分困难。车辆牌照的分割是一个寻找最符合牌照特征区域的过程。从本质上说,就是一个在参量空间寻找最优定 位参量的问题,需要用最优化方法予以实现。

字符分割:是从获得的牌照区域分割出单个字符(包括汉字、字母和数字)以便于进行字符识别的过程。考虑到车牌上的字符一般除了一个汉字外其他的都是字母和数字,即在理想状态下每个字符是全连通的且互不相连,因此可以使用特定的方法进行字符切分。

字符识别:是使分割得到的字符进一步转化为文本并存入数据库或者直接显示出来的过程。

基于小波多尺度和熵在图像字符特征提取方法的改进

基于小波多尺度和熵在图像字符特征提取方法的改进


摘要:提 出了一种基于小波和熵提取图像字符特征的方法。该方法利用小波变 换对图像字符进行多尺度分解,用marr零交叉边缘检测算子提取边 缘;用基于判别熵最小化提取每一尺度图像的边界特征,小波的 “数字显微镜”的优点与熵能确切地表达各类的交叠状况且能直接表达 错误率的特征相结合。与其它方法相比,该方法提取的特征向量稳定 、识别率高、算法快,非常有利于分类,且特征提取的方法有人类视觉 的特点。

关键词:多尺度分析 Marr边缘检测算子 判别熵 特征提取
在线签名验证是通过计算机采集和验证个人签名,从而实现无纸化办公 的一种技术[1]。其中,从采集到的视频图像中提取有效的字符特片 是在线签名验证系统的核心步骤。
随 着计算机和模式识别技术的迅速发展,出现了很多提取字符特征的方 案,最具代表性的有边缘描述法和矩描述法[2]。描述边缘形状的方 法可用曲线拟合和傅立叶描述子方法。傅立叶描述子虽较好地描述了一 封闭的图像轮廓,但其特征很多,噪声和量化误差对具有较低幅值的系 数影响较大。当用FFT计算傅立叶系数,必须将其边界点的长度修成 2的整数次幂,且其描述不具有三个(方向、位置、大小)不变性 ,不能直接用于目标识别,必须进行复杂的变换。这些都影响了它的使 用。矩描述法就是利用图像灰度分布的各阶矩描述图像灰度分布的特征 。矩特征是定义在整个图像空间上的一个二重积分,它同样不具有三个 不变性,使用时必须进行归一化处理。不变矩只是一种旋转归一化方法 ,必须结合大小,位置归一化处理才有三个不变性。

图1

虽 然用这些特征进行图像识别取得了较为满意的效果,但是 ,这些特征的定义都是相当复杂的,运算量很大,并且与人类认知的机 理也是完全不同的,不能直观地理解。本文提出了一种将统计特征与结 构特征相结合的新思路,对字符图像进行小波多尺度分解 ,有效地抑制了图像中的噪声,充分反映了图像结构的精细特征 ;用基于判别熵最小化进行特征提取能确切地表达各类的交叠状况 ,且能直接表达错误率,从而有效地提高识别率。
1 小波多尺度分解
为了寻找空间的L2的基,先从L2的某个子空间出发 ,在这个子空间中先建立基底,然后利用简单变换,把这个基底扩充到 空间L2上,以形成一组基。这就是多尺度分析方法[3][4]。
对 于二维的情况,设{V2J}jez是一个可分离的MRA :V2J=VjVj,其中{V2j}jez是L2(R2 )的一个MRA,其尺度函数为¢是一维MRA{V2j }jez的实值尺度函数,小波母函数采用Dabuechies [6]小波;相应于二维尺度函数V2j=VjVj,定义三个函数:
构成子空间W2j的正交标准基,而它们的伸缩平移系(简写)为:
是L2(R2)的一个标准正交基。
在 本系统中,通过与计算机相连的手写板及电子笔将签名采集到计算机 并显示在屏幕上。采集并输入到计算机中的图像是二维 ,本文中设要分解的图像为f (x,y)ΕL2(R2)。为方便,设L2(R2)-V2N ,即令fN是f在V2N的正交投影。这样关于f的有限小波分解就是 对fN的分解。由于:
假定{V2j}jez上的尺度函数Φj,Φj(x,y)=2jΦ (2jx,2jy)为二维MAR{V2j}jez的尺度函数 ,小波函数ψ(α)j, α=1,2,3已分别由式(1)和式(2)给出,并由阵列 {CNk1,k2},(k1,k1ΕZ2),使得:
其中,Cn,k1,k2=
同样,有:
式 中(6),j=N-1,Λ,N-M。fj是fN在f2j上的低通 滤波信号,而gαj, α=1,2,3是fN在W2j上的三个高通滤波细节 。再设有限长序列{Pk1}、{Pk2}分别是平面(x,y )上x方向与y方向的高通滤波系数,{gk1}与{gk2 }分别是x方向与y方向的低通滤波系数,则由式(6)得到:
上式中箭头右部分是左部分的矩阵表示,其中CN是原始信号f(x ,y)的分布阵列,Pr、Pc是分别对CN的行与列作低通滤波的算 子,而Qr、Qc是分别对CN的行与列作高通滤波的算子 。而进一步地第j次分解应为:
式 (7)中,j=N-2, Λ,N-M。式(7)便是二维信号fN或CN的有限正交小波分解的 Mallat塔式算法[5]。通过实验,选用Daubechies 8小波能达到较好的分解效果。对采集进入计算机的真实签名与伪造签 名进行小波分解,限于遍幅,本文只给出了真实签名的一次分解图 ,如图书1所示。
通常在实验中,借助Matlab6.5将真假签名 的字符图像通过两 个互补滤波器即低通滤波器和高通滤波器分别得到图像的相似和细节部 分。相似子图主要是原始图像的全局、低频成分,而细节子图通常是原 始图像的局部、高频成分。细节子图又包括水平子图 、斜向子图和垂直子图三部分。其中细节子图经过两次滤波 :水平方向允许低频分量通过,而沿垂直方向允许高频分量通过 。这对横向笔划(灰度变化沿水平方向为低频,沿垂直方向为高频 )是增强,而对竖笔划(灰度变化沿水平方向为高频 ,沿垂直方向为低频)是平滑。垂直方向和斜方向的像素按同样的道理 分别在垂直子图和斜子图中被突出表示。这种方向选择性与人眼视觉特 性相吻合,使建立在此基础上的特征提以算法具有类视觉特性。

图2

2 零交叉边缘算子
经 典的边缘检测算子有Sobel算子、Laplace算子 、Marr算子等,近年来又有学者提出了广义模糊算子[7] 、形态学边缘算[8]等。而Marr边缘检测算子 ▽2G被誉为最佳边缘监测器之一,所以本文采Marr算子 。该算子的特点是利用高斯滤波器对图像进行平滑。二维高斯滤波器的 响应函数。设f(x,y)为二值图像函数,由线性系统中卷积和微分的可交换 性,得▽2{G(x,y)хI(x,y)}={ ▽2G (x,y)} хI(x,y),即:对图像的高斯平滑滤波与拉普拉斯微分运算可结合成一个卷积子 如下:
用上述算子卷积图像,通过判断符号的变化确定出零交叉点的位置 ,就是边缘点。对小波一次分解后的真实签名的处理结果如图2所示。
通过图2可以看出,Marr零交叉边缘算子同时提取了强、弱边缘 ,并且边缘相对干净,噪声干扰少,连续性好。
3 基于判别熵最小化的特征提取
不 同的类样本占有不同的特征空间的区域,只要这些区域不相交叠 ,它们就可以分开。经常用样本间的平均距离作为特征提取的判据函数 。重要的距离有Minkowski度量ΔM、欧氏距离δE 、Chebychev距离δr、平方距离δQ和非线性度量δN等 。在不考虑各类的概率分布时,不能确切地表达各类的交叠状况 ,且不能直接表达错误率。为此,应考虑概率距离,利用不确定性最小 的分征进行分类是最有利的,故可用熵来度量后验证概率分布的集中程 序。
某此概率分布密度偏离给定标准分布的程度的度量,叫相对熵 。本文假定经小波和Marr算子处理后的图像函数?(xi,yj )的概率分布为P(xi,yj),给定标准分布ω(xi,yj) ,则两者之间的相对熵为:
求和应在该特征所有可能的取值上进行。
相对熵越小,这两类概率分布的差别就越大,当两类概率分别完全相同 时,相对熵达最大值(等于零)。因此可以定义判别熵W(p,q )来表征两类分布p(xi,yj)和q(xi,yi)的差别大小。
在多类情况下,可以用ΣnΣmW(p(n),q(m) )表示各类分布之间的分离程度。这里n,m代表类别号。
对特征提取来说,在给定维数d的条件下,求得这样d个特征 ,它使上述判别熵最小。为了计算方便,本文用下列函数-U(p ,q)= ΣiΣj(pi,j-qij)2≤0代替W(p,q) ,而不影响选取d个最优特征的结果。
在不对概率分布作估计的情况下,可以用经过归一化处理的样本特征值 代替上式中的概率分布。
K是第一类样本集中的样本号,N1是第一类的样本总数 ,i是特征号。由于, 这样做是合理的。而U取最小值的坐标系统工程是由矩阵A=G (1)-G(2)满足一定条件的d个本征值相应的本征向量组成的 。这里G(1)和G(2)分别是第一类样本集和第二类本集的协方差 矩阵。即将矩阵A的本征向量uk对应的本征值λk,k=1,2 ,ΛD排队:选取本征值对应的本征向量为所要求的坐标轴系统,在这个坐标系统中 判别熵最小。在实验中选取Shannon熵。表1和表2分别列出了 真实签名和伪造签名分解后的各尺度图像的最小判别熵。
由 表1和表2的计算数据可以看出,通过小波一次分解后的最小判别熵 的数据可以很明显地对真假签名进行鉴别。并且,相似图形与细节图形 的最小判别熵相差甚远,区别较大;而细节图形中的水平子图 、斜向子图和垂直子图三部分的最小判别熵却相差较小。因此 ,这样提取的特征向量稳定性好、区别性大、正确性高。

表1 真实签名最小判别熵
  相似图形 水平子图 斜线子图 垂直子图
相似图形 0.0000 56.7827 58.371 60.5942
水平子图 58.371 0.0000 1.5883 3.8115
斜线子图 56.7827 1.5883 0.0000 2.2232
垂直子图 60.5942 3.8115 2.2232 0.0000
表2 伪造签名最小判别熵
  相似图形 水平子图 斜线子图 垂直子图
相似图形 0.0000 101.5640 126.6594 149.2631
水平子图 101.5640 0.0000 25.0954 47.6991
斜线子图 126.6594 25.0954 0.0000 22.6037
垂直子图 149.25631 47.6991 22.6037 0.0000
4 实验结论
对 120个不同的真实签名进行了实验,且每份真实签名对应20个不 同的伪造签名,用小波分别对这些签名图像进行6次分解 ,各选取其中的256幅图像,分别进行边缘连接及最小化判别熵特征 提取,鉴别率达到了98.7%,取得了令人满意的结果 。通过以上的理论分析和实验验证说明,用小波分解使原来单一的时域 信号分解为不同频率尺度下的信号不仅能获得图像在各尺度上的细节信 息,且噪声干扰少,边缘清晰;在特征提取时用熵函数的期望值表征类 别的分离程度,可以作为分类有效性的评价。该方法的优越性对提高在 线签名验证的精确性具有重要的意义。
欢迎访问、交流!对本博客有何建议,请
来信告知!
本博内容来源于网络,如有不当或侵犯权益,请来信告知,将及时撤除!
如引用博客内容、论文,请注明原作者!

Google一下本博客

  • 《Getting Things Done》读书笔记 - 本文来自 inertial 原创投稿。 我第一次听说《Getting Things Done》这本书的时候误以为它和世面上的那些成功学书籍没什么区别,后来在不少书中看到了这个名字,也看见了很多人的推荐,由此产生了很大的兴趣。上个月正好有不少空闲,就抽时间把这本书读完了。 本来打算读英文原版,但是原版的生...
    5 年前
  • [原]Linux下编译使用boost库 - Boost库是一个可移植、提供源代码的C++库,作为标准库的后备,是C++标准化进程的开发引擎之一。 Boost库由C++标准委员会库工作组成员发起,其中有些内容有望成为下一代C++标准库内容。在C++社区中影响甚大,是不折不扣的“准”标准库。Boost由于其对跨平台的强调,对标准C++的强调,与...
    6 年前
  • [原]猎头、培训与咨询的价值(2)【补1】——北漂18年(93) - 【上期用手机写的,同时用语音输入转化成文字,错字较多,经好友霍师傅提醒本期重写,并增加一部分新内容】 简单谈下我对猎头、培训与咨询的看法。三样都干过,算是有些浅见。 猎头 简单的说就是人才中介。虽然在公司看来是可以直接解决现有企业问题的一个直接方法,但很多时候都不太管用。 猎头费一般是人才的一个月月...
    6 年前
  • OpenCV統計應用-Mahalanobis距離 - Mahalanobis距離是一個可以準確找出資料分布上面極端值(Outliers)的統計方法,使用線性迴歸的概念,也就是說他使用的是共變數矩陣以及該資料分布的平均數來找尋極端值的產生,而可以讓一群資料系統具有穩健性(Robust),去除不必要的雜訊訊息,這邊拿前面共變數矩陣的資料為例,並且新增了兩個點座標向量來做...
    15 年前
  • 努力推进模式识别实际产品的开发与应用 - Salu 无论是手写体识别、文档处理、人脸识别、基于内容的图片搜索、嵌入人工智能的搜索技术、虚拟网络社区、还是其它相关新科技下的信息整合领域,现在都在努力实用化。 前两年、即使现在还有很多人在抱怨说人脸的方法都不能用,但是就今年出现的和正在做的有关人脸识别实际应用的各种形式的产品可以说如雨后春笋。这是一个趋...
    15 年前