2008年7月5日星期六

字符分割

定位出车牌区域后,下面介绍了有关字符分割技术的基础上,针对车牌字符串的特点,对一般的车牌字符分割算法进行了说明。然后,提出了一种新的车牌字符分割算法。即基于改进的扫描线算法确定字符串上下边界,利用全局分割和局部调整的技术实现单个字符的分割。

1.1字符分割的基础
字符分割的 任务是把多行或多字符图像中的每个字符从整个图像中分割出来,成为单个字符。对于字符分割的问题常常不被重视,但是字符的正确分割对字符的识别是至关重要 的。由于字符字体存在着多样性,所以在一般的字符识别系统中,字符识别之前要先对图像进行阈值化,然后再进行行字切分,以分割出一个个具体的二值表示的字 符图像点阵,作为单字符识别的输入数据。由于获得的文本图像不但包含了组成文本的一个个字符,而且包含了字符行间距与字间的空白,甚至还会带有各种标点符 号,这就需要采用一定的处理技术将文本中的一个个字符切分出来,形成单个字的图像阵列,以进行单字识别处理。这就需要两个步骤来完成,行切分和字切分。首 先由行切分得到一行行文本,然后在每行文本中进行列切分得到一个个单独的字符。

1.1.1行切分技术
行切分就是要将一行行字符切分出来,形成单行字符文本图像数据。这里我们以含有汉字的图像为例,介绍一下行切分技术。对于输入的二值化汉字图像从上到下逐行扫描并计算每个扫描行的像素,以获取图像的水
平 投影。我们会发现汉字图像沿行方向的水平投影比较有规律,投影中的每个波峰与图像中的每个文本行相对应,在相邻的两行之间有比较宽的一段投影信息为0,这 是对应了相邻两行之间的空白区域。根据这个规律,对行切分比较容易,可以把整幅的汉字图像在水平方向投影后,直接对汉字图像进行行切分。具体方法为:首先 分析投影图像,找到投影波峰所对应的文本行的位置,从而可以计算出每行的行距;其次对所有行的行距累加求和后,求出文本图像的标准行距,以标准行距对汉字 图像进行行的粗切分;最后在每一个粗切分出的行附近上下扫描,进行细微调整,选取最合适的分割位置。
4.1.2字切分技术
字切分是从切分出的文本图像行中将单个的字符图像切分出来。字切分的正确与否直接影响识别结果,是字符识别系统中比较难的部分。我们还是以单个的汉字切分为例来说明。
可 以借助汉字图像行切分的思想,来确定字切分的主要方法:利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隔将单个的字符图像切分出来。事实上,分 析图像行的垂直投影可以发现,垂直投影上的空白间隔部分不仅没有行与行之间的空白间隔部分宽,而且分布也不均匀。是因为在汉字文本中一般汉字间距远不如行 间距明显,同时汉字中有相当数量汉字是左、右结构或左、中、右结构的,这些汉字图像的垂直投影在一个单字的内部也会出现空白间隙,使得文本汉字的字切分比 行切分困难。为了解决这个问题,可以利用汉字间的间隔一般大于汉字内间隔这一特点先进行汉字的粗切分,再根据汉字基本是个方块图形这一事实进行细切分。具 体实现为:根据汉字的行切分,可以获得汉字的高度信息,从而可以估计出汉字的基本宽度;对粗切分出的每个汉字,以此宽度信息进行衡量,以粗切分的起始位置 为出发点,向左右两方向进行搜索,对起始位置进行细微的调整,从而使得字的切分更准确。这种方法不仅可以保证单个汉字的内部结构不被分离,而且还避免了切 除汉字的边缘,其切分结果基本提取出了完整的汉字,消除了笔划的误切除。
1.2车牌字符分割简介
1.2.1车牌字符串的特点
车牌照上的字符串具有以下几个特点:

(1)同一类的实际车牌中的字符位置是固定不变的,一个车牌上的所有字符的高宽比是相等的(除了“1” 外)。
(2)根据牌照种类的不同,有的牌照是有边框的,不能直接进行投影分割。
(3)车牌上的字符与背景对比较大,但是由于曝光、焦距等原因,字符产生横向扭曲,而非字符区域时常也有高亮度区域。
(4)由于车牌自身的磨损等原因或采用的二值化算法的局限性,使得在图像预处理之后,仍然存在断裂的字符。
(5)车牌的字符串信息受到车牌污损及两个铆钉信息的影响。其中特点(1)是在牌照字符分割时的有利信息,如:字符固定的高宽比等。其余的特点都增加了车牌字符分割的难度。
4.2.2车牌字符分割的一般算法
对分割出的车牌进行字符的分割,是为了最终的字符识别而进行的。主要是准确定位出车牌中每个字符的上下左右边界,将其以单个字符图像的形式分割出来,作为字符识别部分的输入。目前现有的车牌字符的分割
方法都基本借助了投影信息来实现的,这里简单介绍两种。
上海同济大学的叶晨洲等提出的方法是:为了获得每一字符的始末位置,取得图像竖直方向投影直方图信息,根据该投影图的期望E与方差决定一阈值θ,θ=E-D。根据投影直方图与θ的比较来决定潜在字符的始
末位置。随后依据字符特征检查起始位置后的邻域及结束位置前的邻域,判断这些潜在始末位置的可靠性,将可靠性低的点略去后对潜在始末位置进行匹配。随后根据字符宽度和相对位置验证匹配结果,进行调整,最终将字符分割出来。
北 京理工大学的吴大勇、魏平等提出了基于区域最小值判断分割点的算法。根据车牌字符垂直投影的信息,区域最小值的定义是以当前像素位置为中心,指定区域宽度 内的投影信息最小值。在确定具体分割点时,先找投影信息的波谷横坐标X,接着利用以X为中心的区域最小值与图像在X处的垂直投影进行比较,如果相等,则判 断X才是真正的分割点坐标。

4.3车牌字符分割方法
为了准确识别牌照上的汉字、英文字母及数字,必须把单一字符从牌照中提取分离出来。在实际处理中,我们面对的要识别的牌照字符背景非常复杂,存在较大的干扰、噪声,这是由于光照不均匀及摄象机等设备噪
声引起的,同时,经过牌照定位而分割出的牌照区域亦非完全是精确到牌照上的字符区域,特别是处理歪斜牌照,所面对的是在牌照四个边框附近误差一、二个象素左右,当字符为白字时还有汽车保险杠与牌照四条边框的残缺图象以及牌照上两个铆钉干扰的一个区域。

标 准的车辆牌照(军车、警车、教练车、领事馆车除外)上有七个字符,首位为省名缩写(汉字),次位为英文字母,再次位为英文字母或阿拉伯数字,末四位字符均 为数字,字符总长度为409毫米,其中单个字符统一宽度为45mm,高90mm,第二、三个字符间间隔为34mm(中间小圆点10mm宽,小圆点与第二、 三个字符间间隔分别为12mm),其余字符间间隔为12mm。充分利用这些先验知识有助于单一字符边框的精确切分。
本文借助牌照字符固定宽度、间距的固定比例关系等先验知识,采取如下步骤从上述复杂背景中去除干扰,确定字符边界,提单一字符。

步骤1:计算Wl=LPLength/9,其中LPLength是牌照图象长度,对牌照图象进行扫描,凡大于Wl的线段可以认为是保险杠与牌照四条边框,由该线段进行区域生长,因此去除保险杠与牌照四条边框的残缺图象。

步骤2:采用Freeman链码跟踪技术,去除牌照背景的噪声干扰、牌照第三字符中间的小圆点和独立铆钉的干扰。由于光照不均匀和二值化的原因,有时铆钉图象会与牌照第二第六字符粘连,对于这种情况,我们在步骤5中解决。
步骤3:字符行粗分割,此时的牌照图象上仅残留铆钉图象及部分左右牌照边框的干扰,分析在Y轴方向投影,很容易确定字符区域的上下边界LineStart和LineEndo
步骤4:单一字符左右边界切分,首先确定(所有七个)字符区域左右边界RowStart和RowEnd,得到字符区域总长度LPWidth,当然,RowStart与RowEnd可能受到牌照左右边框残留线段干扰。计算单一字符宽度
harW=LPWidth*45/409, 字符间距Space=LPWidth*12/409,第二字符和第三字符间距ace2=LPWidth*34/409,考虑光照不均匀和二值化的因素,实 际的二值化牌照图象中,字符宽度和间距与上述计算值有1-2象素点的浮动。对从LineStart到LineEnd的字符图象在X轴上作投影,由于最稳定 的
是第二字符和第三字符间距Space2,因此我们首先从投影图上检测这一间距,得到第二字符的右边界X_End[2]和X_Start[3], 并以X_End[2]为指导向左检测第二字符的左边界X_Start[2],并以XStart[2]为指导检测第一字符(汉字);同样,并以 X_Start[3]为指导向右检测第三~七字符。
步骤5:由于粘连铆钉对第二和第六字符影响及牌照歪斜,步骤3检测到的LineStart和LineEnd并非每个单一字符的上下边界,我们检测第三、四、五字符的上下边界,计算出上下边界线,以此确定其他字符的上下边界,并去除铆钉干扰。
实 验表明,我们的字符切分方法分割成功率几乎达100%。由于噪声干扰、光照不均匀等因素,以及二值化等过程的影响等,待分割的牌照字符有时会字迹模糊残 缺、相邻字符粘连,易产生错分现象;或是处于牌照边缘的字符在牌照定位过程中未能被准确纳入定位后的牌照范围,即牌照定过程分割出的牌照区域只有六个半 字,或六个字。我们借助牌照字符固定宽度、间距的固定比例关系等先验知识,简单、快速地解决了这些问题,即使万一错分,也将其缩小在最小范围(一个象素 点),避免错误的扩散,影响下一字符的切分。
我们没有对牌照图象进行几何校正,这是因为牌照歪斜一般不超过5度,我们实验中所识别的牌照都很小,字符最小为10*5象素点,最大也只有18*10象素点,旋转中计算非整格点象素值误差影响很大,旋转后反而不易字符分割。
1.4小结
车牌字符的提取和识别是由监控计算机中的车牌取模块来完成的,字符提取是车牌定位系统的重要和
介绍了一种基于投影法的字符分割方法。

没有评论:

发表评论

欢迎访问、交流!对本博客有何建议,请
来信告知!
本博内容来源于网络,如有不当或侵犯权益,请来信告知,将及时撤除!
如引用博客内容、论文,请注明原作者!

Google一下本博客

  • [原]Linux下编译使用boost库 - Boost库是一个可移植、提供源代码的C++库,作为标准库的后备,是C++标准化进程的开发引擎之一。 Boost库由C++标准委员会库工作组成员发起,其中有些内容有望成为下一代C++标准库内容。在C++社区中影响甚大,是不折不扣的“准”标准库。Boost由于其对跨平台的强调,对标准C++的强调,与...
    6 年前
  • [原]猎头、培训与咨询的价值(2)【补1】——北漂18年(93) - 【上期用手机写的,同时用语音输入转化成文字,错字较多,经好友霍师傅提醒本期重写,并增加一部分新内容】 简单谈下我对猎头、培训与咨询的看法。三样都干过,算是有些浅见。 猎头 简单的说就是人才中介。虽然在公司看来是可以直接解决现有企业问题的一个直接方法,但很多时候都不太管用。 猎头费一般是人才的一个月月...
    7 年前
  • 我的时间管理道与术(三) - 本系列来自 水中颉 原创投稿。 本文续上篇《我的时间管理道与术(一):接受现实和感知时间》和《我的时间管理道与术(二):目标与计划》。 建立至上而下的检视机制 六个关注层面和检视周期 宗旨和使命、关键路径是云端;关键点和平衡点是方向指导层;项目是最接地气的现实目标层;下一步行动 是非常具体的待执行事务层...
    8 年前
  • OpenCV統計應用-Mahalanobis距離 - Mahalanobis距離是一個可以準確找出資料分布上面極端值(Outliers)的統計方法,使用線性迴歸的概念,也就是說他使用的是共變數矩陣以及該資料分布的平均數來找尋極端值的產生,而可以讓一群資料系統具有穩健性(Robust),去除不必要的雜訊訊息,這邊拿前面共變數矩陣的資料為例,並且新增了兩個點座標向量來做...
    15 年前
  • 努力推进模式识别实际产品的开发与应用 - Salu 无论是手写体识别、文档处理、人脸识别、基于内容的图片搜索、嵌入人工智能的搜索技术、虚拟网络社区、还是其它相关新科技下的信息整合领域,现在都在努力实用化。 前两年、即使现在还有很多人在抱怨说人脸的方法都不能用,但是就今年出现的和正在做的有关人脸识别实际应用的各种形式的产品可以说如雨后春笋。这是一个趋...
    16 年前