文献标识码:A
DOI:10.16157/j.issn.0258-7998.2016.12.023
中文引用格式:贺康建,周冬明,聂仁灿,等. 基于局部控制核的彩色图像目标检测方法[J].电子技术应用,2016,42(12):89-92.
英文引用格式:He Kangjian,Zhou Dongming,Nie Rencan,et al. Target detection method based on local steering kernel of color image[J].Application of Electronic Technique,2016,42(12):89-92.
0 引言
近年来计算机技术快速发展,计算机智能为人们的日常生活带来诸多方便。随着人们需求的日益增长,目标检测与定位逐步进入到人们的实际生活中[1,2],随着对人体动作识别、人机交互技术的深入研究,计算机视觉系统也变得越来越智能。使用计算机进行特征检测、目标跟踪、目标检测及定位等技术得到了研究人员的广泛关注,这些技术也开始应用到人们的日常生活中。本文采用图像局部控制核算法[3],实现了对不同目标的快速检测与定位。目前对于目标检测及定位问题,有关研究人员提出了许多新颖的算法,但大多数算法需要进行繁琐的训练和预处理过程。如参考匹配法[4]将隐马尔科夫统计模型引入到目标参考匹配,此方法的局限性是无法从图像内容来解释并确定隐马尔科夫模型的参数,只能通过一系列的实验来选择最优参数,这一问题限定了图像识别中隐马尔科夫模型[5]的进一步应用。还有一种多检测目标自动定位监测技术主要是基于图像像素的单阈值分割法[6]的运用,此类定位方法过程繁琐耗时。本文提出采用图像局部控制核算法来对目标进行快速的配准、检测与定位[7]。
1 算法描述
本文采用局部控制核[8]的方法,获取图像像素点的几何结构信息,提取出图像的结构特征,将目标图像分割成与目标参考图像大小一致的一系列子图,参考图像即为所需查找定位的目标,最后分析包含图像特征信息的数据矩阵之间的相似性来达到目标检测的目的。算法流程图如图1所示。
1.1 局部控制核函数LSK
局部控制核函数(Local Steering Kernel,LSK)是在评估梯度的基础上通过分析像素值的差异来获取图像的局部数据结构,用所获取的结构信息确定核的形状和大小,用径向对称函数来表示局部核函数,表达式如式(1):
式中,n和nT分别是在参考图像Q和目标图像T中计算LSK所用到的子块数目。
1.2 获取主要数据特征(降维)
1.3 矩阵相似性判决准侧
得到ρi以后,就可以分析参考图像Q和目标图像Ti之间的相似性关系。如果夹角为0°,意味着方向相同、线段重合;如果夹角为90°,意味着形成直角,方向正交;如果夹角为180°,意味着方向正好相反。为更好地体现向量间的差异,用与1-的比值来衡量两向量的相似度,即f(ρi)=/(1-),f(ρi)∈[0,∞]。这样,就将相似度的范围从[0,1]扩展到[0,∞]之间,可以更好地突出向量间的微小差异,更能体现两者的相似程度。
1.4 保留最大相似区域
在图像中目标的检测与定位过程中,设定一个整体阈值τ0,将f(ρi)与τ0作比较,若f(ρi)>τ0就认为目标图像与参考图像相似,最终的定位与检测的准确度与相似度可以通过调节τ0来实现。这样就可以得到一个相似区域,然后,进行非极大值抑制,即只保留maxf(ρi)的对象,就是最终的检测与定位结果。maxf(ρi)>τ0表明目标图像中有需要检测的参考图像,maxf(ρi)<τ0,则目标图像中不存在所感兴趣的对象。
所有相似性区域子图块位置和保留最大相似区域实验结果如图2所示。
2 实验结果与分析
为了验证该算法的有效性,本文选取两组图作为实验数据。其中一组图像是对卫星接收器进行定位,如图3所示。
实验结果如图4所示。图4中,不同颜色代表不同的相似度,蓝色(区域1、3)到红色(区域2、4)表示的相似度依次增强,实验选取的参考图像为目标图像中最左侧的图像,所以定位结果中最左侧的定位结果为红色,与参考图像最为接近。图4(c)中可以看到检测出不同的相似区域,可以通过调节整体阈值来决定不同相似度区域的取舍,最终定位出结果。
下面给出另一组人脸检测与定位实验,并分析灵敏度?琢对准确度与计算复杂度的影响,实验结果如图5所示。
由于式(3)中参数灵敏度α影响检测的准确度与运算速度,在实验中,选取α=1.0。从表1与图5中可以看出,灵敏度α越小,计算出的显著性区域即与参考图相似的子块区域越大,检测结果越准确,但需要很大的计算复杂度;α越大,相似性区域越小,检测时间越短,但有可能造成检测目标的缺失,如图5(e)中所示。
3 结论
本文采用的目标定位算法对图像中的参考图像目标进行定位,该算法不需要过多的预处理和训练过程,只需要输入一个参考图像来获取所需定位目标的结构信息矩阵,再用局部保留投影(LPP)对图像矩阵进行降维,提取显著特征,进而与目标图像的相似特征进行匹配,用余弦相似性方法作为判决依据。由实验得知,该算法是一个通用的定位算法,参考图像和目标图像里的定位图像不需要严格一致。从实验1看出,在目标图像中,定位目标的角度、方向、亮度和目标大小等信息不一致,仍准确定位出3个目标;在实验2中也可以看出,在复杂的图像背景下,输入的参考与检测目标有一定的差异,仍能检测定位出人脸信息,说明本算法的有效性和通用性。
本文算法的局限在于,检测目标图像中的目标时,目标图像中目标的大小应大致与参考图像大小一致,这样对检测图像分割成一系列与参考图像大小一致的子图块时才能进行特征点相似性判决。针对目标图像中目标大小与参考图像大小不一致的问题,可以通过缩放参考图像来解决。在参考图像与目标图像存在形变时,若目标的局部几何形状特征明显,能提取出特征,则可以通过调节相似度阈值τ0来实现对目标进行检测与定位,但会造成定位精度下降。有关算法的参数设置,目前没有自适应的优化参数方法,只能做大量实验选取最优参数,随着这一问题的解决,必会使此算法得到更广泛的应用。
参考文献
[1] 喻鑫,明德烈,田金文.前下视红外图像中复杂地面背景下的目标定位[J].红外与激光工程,2007,6(6):988-991.
[2] 杨威,付耀文,潘晓刚,等.弱目标检测前跟踪技术研究综述[J].电子学报,2014,42(9):1786-1793.
[3] SEO H J,MILANFAR P.Training-free,generic object detection using locally adaptive regression kernels[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2010,32(9):1688-1704.
[4] 任仙怡,张桂林,张天序,等.基于奇异值分解的图像匹配方法[J].红外与激光工程,2001,30(4):200-202.
[5] 刘小军,王东峰,张丽飞,等.一种基于奇异值分解和隐马尔可夫模型的人脸识别方法[J].计算机学报,2003,26(3):340-344.
[6] 陈果,左洪福.图像的自适应模糊阈值分割法[J].自动化学报,2003,29(5):791-796.
[7] 邓集洪,魏宇星.基于局部特征描述的目标定位[J].光电工程,2015,1(1):58-64.
[8] KUMAR Y,GAUTAM J.Training-free video indexing scheme using local steering kernel[J/OL].(2012)[2016].http://www.tjprc.org/files/2-15-1371044563-1.Training%20free%20video.full.pdf.
[9] WONG W K,ZHAO H T.Supervised optimal locality preserving projection[J].Pattern Recognition,2012,45(1):186-197.
[10] YE J.Cosine similarity measures for intuitionistic fuzzy sets and their applications[J].Mathematical & Computer Modelling,2011,53(53):91-97.