一种新的粘连字符图像分割方法
针对监控画面采样图像中数字的自动识别问题,提出一种新的粘连字符图像分割方法。该方法以预处理后二值图像的连通状况来判定字符粘连的存在,并对粘连字符图像采用上下轮廓极值法确定候选粘连分割点,以双向最短路径确定合适的图像分割线路。仿真实验表明,该方法能有效解决粘连字符图像的分割问题。
关键词: 字符分割; 连通状况; 粘连字符; 轮廓; 最短路径
随着监视器等设备的广泛使用,自动采集、记录和分析监控画面信息在实际应用中变得越来越重要。而使用CCD摄像头采集画面字符时,由于字符本身的大小、字体、字符间距以及摄像头自身分辨率不高等原因,有可能造成图像中字符的粘连。所以,在识别、分析、记录前必须对粘连字符进行分割。
参考文献[1]中提出了基于字符投影的粘连分割方法,主要包括字符垂直投影、字符波形投影处理,但该方法分割准确率不高,且分割路径只能垂直进行,会造成字符损伤,影响后期识别。参考文献[2]采用了轮廓分裂与区域合并相结合的算法,能够分割粘连字符,但过程复杂且准确率不高,抗干扰性一般。参考文献[3]提出了一种基于骨架形态分析的粘连分割算法,但该方法利用阈值判定分割点位置和路径,降低了准确率。参考文献[4]采用滴水算法,模仿水滴从高处向低处滴落的过程实行对粘连字符的分割,即水滴从字符串顶部在重力的作用下沿字符轮廓向下滴落或水平滚动,最终水滴所经过的轨迹就构成了字符的分割路径。但当水滴陷在轮廓的凹处时,将渗漏到字符笔划中,会穿透笔划后继续滴落,易导致字符笔划断裂,因此也不能从根本上解决粘连字符的分割问题。参考文献[5]采用了最短路径算法,但其实行单向搜索路径,且分割点的确定不准确,因此分割准确率不高。本文在参考文献[5]的基础上,设计了一种基于双向最短路径的粘连字符图像分割方法,以期解决上述分割方法造成的字符损伤问题,并提高分割正确率和抗干扰能力。
1 粘连字符图像分割算法
摄像头采集到的图像为彩色图像,直接处理复杂且效果不好,因此需要对图像进行滤波、直方图均衡化、颜色聚类得到二值图像。经过预处理后的图像,由于字符本身的因素以及摄像头自身分辨率不高等原因,会造成图像中字符的粘连,因此通过提取连通分量,再采用二维检测器[6]方法将连通分量分类。下面简要介绍二维检测器的基本思想。
通过连通分量的宽高比和标准笔划数[6]2个特征来确定单字符在二维空间的分布,从而得到1条直线用以正确判别单字符和粘连字符。如果这2个特征构成的点落在直线的下方,则认为连通域包含1个字符;如果由这2个特征构成的点落在直线的上方,则认为连通域包含多个字符。
经过上述方法处理后,字符被分为两类:一类为单字符,另一类为粘连字符。前者直接送入分类识别器,后者需进行再分割。在对粘连字符图像进行分割后续处理时,为避免出现参考文献[1]~[4]的情况,以双向最短路径为基本思路,设计了一种新的粘连字符图像分割方法。首先分析粘连字符图像的上下轮廓,确定候选分割点,再以分割点开始,遵循最小代价原则搜索分割路径。该方法的具体流程如图1所示。
预处理后的粘连字符图像总是在其上下轮廓间的最短距离处发生粘连[7],如图2(a)所示,通过确定粘连字符的上下轮廓,并求得上下轮廓的极值点,可以确定候选分割点。参考文献[8]在解决图书索引书号粘连字符的分割问题时,为确定字符的宽度,给出了字符串上、下轮廓的定义。
设待处理的二值图像为b(i,j)∈[0,1],其中,0为背景,1为前景,i=1,2,…,m,j=1,2,…,n,则字符串上轮廓可由b(i,j)中自上而下扫描到每列的第1个黑色像素点;相反可以给出字符串下轮廓的定义。这样它们可以用一维向量top(j)和bottom(j)表达,其生成方法可形式化描述如下:
For j=1:n
For i=1:m
if b(i,j)=1,top(j)=i;
if b(m-i+1,j)=1,bottom(j)=m-i+1;
此处注意,当某列无字符时,表明无黑色像素点,则令top(j)=1,而令bottom(j)=m。据此,可检测到粘连字符图2(a)的上、下轮廓如图2(b)所示。
接下来,分别求取top(j)=1和bottom( j )=m的局部极大、极小值点,从而求出上、下轮廓的极大、极小点,即可视为字符粘连位置。以上面确定的极值点作为起始分割位置,分别以向上或向下双向最小代价分析的策略来寻求最短分割路径。定义分割移动方向的代价函数是很关键的。
从(x,y)点出发,以向下遍历为例,按照滴水算法[4]和最短路径[5]的思想,给出规定的3种可分割方向:垂直方向和左、右对角线方向。参考文献[9]定义代价函数fee(i,j)如下:
向上遍历代价函数与此类似。搜索1条完整路径的处理流程如图3所示。
2 实验结果和分析
选择预处理后的二值字符图像200幅进行了仿真实验,共包含字符串525个,粘连字符125个。分割实验的部分效果如图4所示。
对参考文献[3]提出的骨架形态分析算法、参考文献[4]提出的滴水算法的分割正确率进行了比较,实验数据如表1所示。可以看出,骨架形态分析算法和滴水算法在分割粘连字符图像时,正确分割率要低于本文提出的方法。
在数字识别系统中,正确分割出单个字符是字符识别的前提和基础,在同等条件下,分割精度越高识别率就越高。字符粘连、有部分字符干扰是字符分割最棘手的问题,本文以双向最短路径方法设计的粘连字符图像分割策略成功地解决了此问题,与现有方法相比,提高了正确分割率,获得了较好的字符分割效果。
参考文献
[1] 邹荣金, 蔡士杰. 字符粘连及字线相交的分割与识别方法[J].软件学报,1999,10(3):241-247.
[2] 曹迪铭,宣国荣.牌照字符分割中的区域分裂与合并[J].计算机工程,2000,26(10):18-24.
[3] 马瑞. 一种用于手写数字分割的滴水算法的改进[J].小型微型计算机系统,2007,11(11):2110-2112.
[4] 卢达,谢铭培.一种基于骨架法形态分析的粘连字符图像分切方法[J].中文信息学报,1998,2(13): 40-43.
[5] WANG J, JEAN J. Segmentation of merged characters by neural networks and shortest path[J]. Pattern Recognition,1994, 27(5): 649-658.
[6] 张闯,吴铭.非限制自由手写粘连数字串数字个数的判断[J].北京邮电大学学报, 2004,6(27):63-64.
[7] DIMAURO G,IMPEDOVO S, PIRLO A,et al.Automatic bank check processing: A new engineered system[J]. International Journal of Pattern Recognition and Artificial Intelligence, 1997,11(4):467-504.
[8] 胡小锋,陈超,叶庆泰.图书索书号粘连字符的切分[J].上海交通大学学报,2005,38(4):553-556.
[9] 陈兵.用神经网络方法分割粘连字符的一种改进方案[D] .大连理工大学, 2006,6:21-22.
0