基于形态学和梯度特征的二维条码检测定位-AET-电子技术应用

基于形态学和梯度特征的二维条码检测定位

马鹏维1，韩存武2，马海燕1，吕文渊1

1.东华大学信息学院，上海 201620；2.北方工业大学现场总线技术及其自动化北京市重点实验室

摘要：针对复杂背景下的二维条码定位问题，单一特征提取已很难满足其需要。为此提出一种将图像二值化，然后采用基于数学形态学和kirsch边缘检测的算法滤去图像背景，最后利用投影算法定位条码区域。实验结果表明，该方法简单、快速、准确，很好地满足了实际使用的需要。

关键词： 二维条码 kirsch算子形态学

Abstract：

Key words :

摘要：针对复杂背景下的二维条码定位问题，单一特征提取已很难满足其需要。为此提出一种将图像二值化，然后采用基于数学形态学和kirsch边缘检测的算法滤去图像背景，最后利用投影算法定位条码区域。实验结果表明，该方法简单、快速、准确，很好地满足了实际使用的需要。
关键词：二维条码；kirsch算子；形态学；投影

　　目前，条码技术在各个行业得到了广泛的应用。但是一维条码受到信息容量的限制，仅仅是对物品的标识，并且它的使用必须依赖数据库的存在。二维条形码是在水平和垂直方向的二维空间存储信息的条码，它不依赖于数据库，信息容量大、可靠性高，因此必将得到广泛的应用。二维条码的种类很多，有QR、PDF417和Maxi code等。
　　二维条码作为一种应用广泛的自动识别技术，其核心是对条码进行快速、准确地定位。纹理是条码的一个显著特征，目前，主流的算法是基于纹理特征的梯度检测或频域分析[1]来定位二维条码。利用梯度特征进行条码检测与基于频域分析的算法相比较，具有实时性强的特点，适用于大多数图像。
　　条码本身纹理特征主要表现为黑白相间且边缘方向一致的矩形块。考虑各种可能出现的复杂背景情况，采用单一的梯度特征很难满足二维码精确定位的需要。本文提出了一种形态学和边缘梯度信息相结合的方法来提取二维码。该方法不同于大多数的条码定位方法，其对条码在图像中的位置以及图像背景的限制很少，而且综合特征定位要比单一特征定位更符合人的视觉要求，因而定位效果更好，应用范围更广。本文将以QR条码为例，进行条码区域的提取。
1 二值形态学基本原理[2]
　　二值形态学运算是数学形态学的基础，是一种针对图像集合的处理过程。其基本思想是：用具有一定形态的结构元素去度量和提取图像中的对应形状，以达到对图像分析和识别的目的。膨胀(Dilation)和腐蚀(Erosion)是2种最基本、最重要的变换，其他变换都由这2种变换的组合来定义。它们在二值图像和灰度图像中各有特点，还可以推导和组合成各种其他数学形态学算法。
　　按定义，二值图像上目标边界点是指位于目标内部，且至少有1个邻点位于目标之外的像素。用B(x)代表结构元素，对工作空间A中的每1点x，腐蚀和膨胀的定义分别为：

　　简单的腐蚀是一种消除边界点的过程，结果是使目标缩小、孔洞增大，因而可有效地消除孤立噪声点。膨胀是将与目标物体接触的所有背景点合并到物体中的过程，结果是使目标增大、孔洞缩小，可填补目标物体中的空洞，形成连通域。
　一般情况下，腐蚀与膨胀是不可恢复的运算，但通过腐蚀与膨胀可以构成开运算和闭运算。开运算和闭运算的定义如下：

　　先腐蚀后膨胀的过程称为开运算，它具有消除细小物体，并在纤细处分离物体和平滑较大物体边界的作用；先膨胀后腐蚀的过程称为闭运算，它具有填充物体内细小空洞，连接邻近物体和平滑边界的作用。
2 条码区域定位算法
2.1 图像灰度化和对比度增强
　　条形码本身是黑白条码，不需要颜色信息，而且灰度图像的处理速度快，占用空间少，因此首先将图像进行灰度转换。大部分采集二维码的摄像设备性能一般，图像的灰度可能会集中于某一小区间内，如图像过亮或过暗，所以需要根据直方图对图像灰度进行拉伸使之覆盖较大的区间，从而提高了图像的对比度尤其是二维码的黑白对比度，便于对图像二值分割。图1为所处理图像的灰度化。

2.2 基于阈值选取的图像分割
　　在使用阈值法进行图像分割时，阈值的选取成为能否正确分割的关键，阈值过小容易造成过度分割，过大则不易滤除背景。本文将选用最大方差准则[3]确定最佳阈值，区域间的方差是差异的有效参数。分割后图像如图2所示。

2.3 二值形态学运算
　　数学形态学是以结构元素为基础对图像进行分析的数学工具。对于结构元素，其中大尺度的结构元素去除噪声能力强，小尺度的结构元素能检测到好的边缘细节。至于窗口尺寸，在边缘提取的形态变换中，一般采用3×3、5×5、7×7的窗口尺寸。本算法中形态学运算既要去噪(如图像中的直线、表格、方方正正的文字及噪点等)，又要尽量少地影响边缘细节。结合试验分析，选定2个以中心为原点的3×3结构元素，对图像进行腐蚀和开运算。腐蚀和开运算的结构元素3×3矩阵如下：

　　对于如图1所示的有复杂背景(如文字等)的条码图像，采用形态学方法消除了影响进一步提取梯度特征的因素，变成了只有少量噪声的图像，而且滤去了毛边，使图像二维码区域的梯度特征更加明显，其运算结果如图3所示。

2.4 利用方向边缘强度确定条码大致区域
　　条码由黑的条和白的(空)组成，黑白分界明显，具有很强的边缘强度，利用条码的纹理特征，通过分区域对条码边缘方向的分析，可以滤去大部分的文本、图案以及一些大的黑色块状区域干扰。在此过程中，将分区域进行了分析。
　用分块来进行处理，主要是考虑到所获得的图像大小分辨率通常是固定的，先对整幅图像进行分块，图像中的每个块都是一个特征区域，其中特征区域的大小如何确定将是研究的重点。确定的原则是既要尽量细致地反映二维码区域特征，又要兼顾二维码区域边缘分布特征。针对设备的分辨率，把采集得到的灰度图像按网格分割为m×n个子区域，分析每个子区域的边缘强度特征，筛选出可能包含条码的图像子区域。
　　Kirsch算子具有8个方向的模板，有很好的方向性及很好的精度和抗噪性能。图像中的每个点都用8个掩模进行卷积，每个掩模对某个特定边缘方向做出最大响应。

2.5 水平和垂直投影定位条码区域
　　经过上述处理以后，所存在的干扰就非常少了，然后对图像进行水平(垂直)投影，确定最后的条码区域。
　　首先，对图像进行水平投影，其水平像素投影值可看作离散数列，为消除图像中的毛刺或噪声的干扰，可采用加权算术平均法。设Vi表示图像中第i行的原始投影值，V′_i-1表示图像中i-1行平滑后的投影值，则1次指数平滑数列[5]的构成为：

　平滑后的水平投影如图4(a)所示。由于二维码区域的投影比较大，而在二维码区域上下行附近的投影值也比较大，而且均有谷底存在，因此，找到2个谷底位置，确定上下边界，从而完成第1次分割。

　　对第1次分割后的图像做垂直方向的投影，平滑后的投影如图4(b)所示。由于二维码区域峰值比较集中，此时采用从两头寻找条码区域的方法，即从两头分别先找到大于一定阈值的点，然后分别向下找到谷底，即为找到的条码左右边界，这样就得到第2次分割结果。
　　通过2次投影分割，便确定了条码区域的位置，实现了区域定位。若条码区域发生旋转或倾斜，可以进一步采用双线性插值[1]将条码旋转至水平，从而实现条码的精确定位。
采用形态学腐蚀、开运算和求取梯度特征的方法，最终通过投影算法从有复杂背景的条码图像中分割出条码区域，为识读软件定位了二维条码区域，达到了条码自动识别的目的。实验表明，同传统的算法相比，该算法对图像背景要求较少，简单实用，不仅提高了定位速度，也提高了定位准确率，有效地满足了二维条码识别系统实时性的要求。
参考文献
[1] 刘宁钟，杨静宇.基于波形分析的二维条码识别[J].计算机研究与发展，2004，41(3)：463-469.
[2] 李俊山，李旭辉.数字图像处理[M].北京：清华大学出版社，2007.
[3] 刘卫光.图像信息融合与识别[M].北京：电子工业出版社，2008.
[4] 郑翔，黄艺云.Kirsch边缘检测算子的快速算法[J].通信学报，1996，17(1):131-134.
[5] 郭捷，施鹏飞.基于颜色和纹理分析的车牌定位方法[J].中国图像图形学报，2002，7(5)：473-476.

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容