罗帅,娄震
(南京理工大学计算机科学与技术系,江苏南京210094)
摘要:根据人民币背面印刷年份作为人民版本识别的特征,进行人民币版本的识别。提取印刷年份过程包括对图像的采集、边缘检测、图像旋转、最小值滤波等预处理,以及采用投影法对印刷年份字符区域的定位。字符区域被提取出来以后,再使用八向模板匹配的方法,使待测样本与模板样本逐一比较,计算它们的相似度,与待测样本相似度的最大模板样本的版本作为待测样本的版本。采用100张99版和100张05版人民币图像作为样本进行实验,实验结果表明,该方法版本识别率达到97%以上。
教育期刊网 http://www.jyqkw.com
关键词 :人民币;版本识别;投影;模板匹配;图像处理
中图分类号:TN911.73?34;TP391.41 文献标识码:A 文章编号:1004?373X(2015)18?0072?04
0 引言
人民币是国家发行的货币符号,是目前货币的主要流通形式,在国民经济活动中起着至关重要的作用[1]。随着经济的发展,市场的需求,印刷工艺的提高,国家每隔一定的时间就会发行一套新的人民币,这时旧版本人民币就需要回收,以避免旧版本与新版本的混合使用,造成市场混乱,此外版本的混用,也不利于对假币的监督。如果使用传统的人工回收就会造成大量人力资源的浪费且效率低下。所以自动对人民币版本的识别,将会具有十分重要的意义[2]。
人民币版本原始的识别方法是人工识别,这种方法会造成人力资源的浪费。目前在人民币版本识别方面主要有基于纸币长宽不同进行识别和基于局部区域的差别。不同版本的人民币长宽相差很小,甚至第五版50元与第四版5元长宽都一样,这就无法仅用基于长宽来判断纸币的版本[3]。但是不同版本的人民币背部的印刷年份都不相同,因此利用这一特征,就可以采用基于印刷年份这一局部区域的差别来进行版本的判别,这能很好地提高人民币版本的识别率和简化版本识别方法。
1 图像的预处理
图像的预处理是图像识别前十分重要的工作。为了获取印刷年份,需要对图像预处理,包括图像的灰度化、边缘检测、倾斜校正等[4]。因为印刷年份字符位置相对固定,经过预处理就可进行初步的定位和提取,下面以99版100元人民币为基础,探讨基于印刷年份的人民币版本识别。
1.1 图像的采集与灰度化
将人民币背面向上放在固定位置上,通过摄像装置拍摄多幅图像,采集到的图像是RGB彩色图,RGB彩色图几乎包含了人类视力所能感知的所有颜色,干扰信息较多,而灰度图只有图像的强弱信息,此外RGB图像存储三种颜色的信息,所需的内存要比灰度图大得多。所以需要把RGB彩色图转化为灰度图如图1所示。本文采用加权平均法进行图像的灰度化,灰度化公式采用工业标准化公式[3],公式如下:
1.2 图像的边缘检测
检测图像边缘点是为了通过得到的边缘点进行最小二乘拟合得到边缘直线,进而得到图像的倾斜角[5]。从图1可以看出纸币的区域与背景的像素值有十分大的差距,设纸币区域与背景之间阈值为T。由于图像倾斜缘故,边缘点可能不在同一条直线上,因此需要从纸币中间取边缘点。边缘点检测的具体步骤是:x 从80到W-80(W 为图像区域的宽度)由上至下直线搜索上,当灰度值发生阶跃性变化即大于T 标记为边缘点,由下至上直线搜索下边缘点。令上边缘点为P0(x0,y0),下边缘点为P1(x1,y1)。y 从80到H-80(H 为图像区域的高度)由左至右直线搜索左边缘点,由右至左直线搜索右边缘点。令左边缘点为P2(x2,y2),右边缘点为P3(x3,y3)。图2所示绿点部分标出了钱币图像的边缘。
用检测到的所有上边缘点P0,下边缘点P1,左边缘点P2,右边缘点P3进行最小二乘拟合,得到上边缘直线为y = k0 x + d0 ,下边缘直线为y = k1 x + d1 ,左边缘直线为y = k2 x + d2 ,右边缘直线为y = k3 x + d3 ,相邻边缘直线的交点就是纸币的顶点。根据上边缘直线的斜率k1得到cos2 θ = 1 (1 + k12),倾斜角
1.3 图像旋转
边缘检测中得到了顶点坐标和倾斜角θ,只需将图像绕左下角旋转θ度,就可进行图像旋转校正,得到水平图像。设左下角坐标为(x0,y0),原图像上任意一点为(x,y),旋转之后的坐标为(x1,y1),坐标变换矩阵方程为:
由矩阵方程可得到变换后坐标表达式如下:
根据上述公式,便可对图像进行旋转校正。
2 印刷年份的提取
2.1 印刷年份的初步提取
印刷年份位置是相对固定的,图像经过预处理,就可以初步从原图上切割出印刷年份的图像,由于切割出来区域印刷年份字符非常小,不利于识别,需要进行放大处理,本文将分割出来区域的宽高各放大为原来的4倍。放大后印刷年份初步提取图像如图3所示。初步提取出来的图像范围较大,有其他的干扰信息,需要进一步精确定位,图3可以发现字符区域灰度值较小,为了使字符的灰度值与背景区分更加明显,先将图像最小值滤波,最小值滤波后的图像如图4所示。
2.2 印刷年份的精确定位
印刷年份字符与其他区域灰度值有明显差别,且印刷年份字符的高度基本一致。
通过计算印刷年份区域图像灰度值的水平投影,得到其水平方向的差分矩阵记为T1,通过扫描矩阵T1得到一个最大值位置即为上边界,得到一个最小值即为下边界。假设有M×N 个像素的灰度图像f(i,j),则水平,垂直投影差值分别如下:
印刷年份区域及其水平方向的差分如图5 所示。计算垂直投影,得到其垂直方向的差分矩阵T2,扫描T2得到左边界和下边界,印刷年分区域及其垂直方向的差分如图6所示。
3 人民币版本的判别
3.1 字符特征的提取
本文提取的是图像的八向特征,即提取图像8个方向的梯度特征作为统计特征[6]。可以选用Sobel算子或Robert算子来计算图像的梯度,本文选用的是Sobel算子。特征提取步骤如下:选用Sobel 算子计算图像在x方向和y 方向的梯度,图像在点(x,y)处的梯度向量g(x,y) = [gx ,gy ]T 。
根据上述梯度向量g(x,y) = [gx ,gy ]T ,然后把该向量分解到8 个方向上,生成8 个梯度子图,梯度子图如图7所示的。
3.2 字符特征的识别
将提取的特征向量与模板中的特征向量逐一比较,计算两向量之间的欧氏距离[7]。与待测样本相似度的距离最小的模板样本的版本作为待测样本的版本。假设第i 个模板的特征向量为Zi ,图像提取的特征为X,它们之间的欧氏距离如下:
4 实验结果
本实验选取了100 张99 版和100 张05 版的100 元人民币样张,模板样本有99版和05版的图像,将待测样本与模板样本一一匹配,与待测样本最为相似(即欧氏距离最小)的模板样本的版本作为识别结果,最终实验结果如表1所示。
从表1可以看到,利用人民币纸币背面印刷年份特征这一特征进行版本识别具有很高的识别率,在进行八向模板匹配后,其99版和05版人民币的识别都比较理想,完全可以应用到实际的系统中。
5 结语
本文通过对图像处理中已有算法的研究,实现了八向模板匹配的人民币版本的识别,取得了良好的实验效果。这种识别技术不仅可以运用到纸币识别当中,还可以运用到银行卡号,车牌号码等识别当中[8]。当然,该方法也有不足之处,对于纸币有褶皱或残缺会影响实验识别效果,而且纸币的新旧等差别也会对实验结果产生一定的影响,这是有待进一步改进的。
教育期刊网 http://www.jyqkw.com
参考文献
[1] 张露.货币伦理研究[D].南京:南京师范大学,2012.
[2] 吴凯波.人民币均衡汇率的实证研究[D].昆明:云南财经大学,2011.
[3] 丁瑞昕.纸币清分机图像识别系统的研究与设计[D].鞍山:辽宁科技大学,2008.
[4] 高丽燕.基于DSP+FPGA 的图像识别系统设计与实现[D].南京:南京理工大学,2006.
[5] 于新瑞,王石刚,王高中,等.数字图象直线特征的亚像素位置检测[J].光学技术,2004(2):138?141.
[6] 凌璐.美元纸币关键信息的图像检测以及号码识别[D].南京:南京理工大学,2012.
[7] 王琪,万中南,韩俊伟.基于图像中心矩和特征向量的目标识别方法[J].激光与红外,2009(8):895?898.
[8] 梁琎,包志强.人民币冠字号码的提取与识别[J].现代电子技术,2013,36(11):70?74.
[9] 刘倩.基于图像处理的水厂水质浊度检测系统[D].厦门:厦门大学,2013.
作者简介:罗帅(1990—),男,江苏盐城人,硕士。主研方向为模式识别与图像处理。
娄震(1974—),男,江苏南京人,副教授,博士。研究方向为模式识别与智能控制。