摘 要:为了在红外遥控系统中实现手势交互,设计了一种基于双DSP结构的具有动态手势视觉识别功能的红外遥控系统。针对手势识别图像算法的复杂性,系统采用了一种流水线式的动态图像处理模式并提出了一种基于双端口RAM通信的双DSP图像处理硬件系统结构。结构前级负责实时采集图像数据及手势图像预处理,后级结合以帧差法为核心的手势识别算法负责动作识别处理,从而节省单DSP需要的等待时间,手势图像处理任务同步进行,加快动态图像处理的速度。另外,双DSP结构使得系统资源得到有效分配,复杂处理算法同步运行,再配合自学习红外遥控模块实现红外遥控功能。实验结果表明,系统一次手势动作的最短识别时间为1.5 s,动作识别的准确率达到93.75%,具有良好的稳定性和可操作性。
关键词:双DSP结构;CMOS数字摄像头;手势识别;红外遥控
随着人机交互技术的发展,手势识别交互的原理和应用已被国内外许多学者从不同的角度、不同的层次进行了研究[1-2]。近年来,传统按键式的红外遥控器已经成为现代家庭电子消费品中广为人知的一种电子产品,而基于视觉的手势识别交互技术与传统红外遥控技术的结合,逐渐成为人们研究手势人机交互应用的新热点[3]。手势识别红外遥控系统整合了新一代手势人机交互技术,从而改变了传统的按键模式,在某些红外遥控的场合具有传统遥控器所无可比拟的便捷和人性化的用户体验。手势红外遥控系统的结构大多都基于PC实现,若要在专门系统独立实现,硬件系统一般都要根据具体要求进行特别的设计[4-5]。在充分考虑了算法实现的灵活性和实现结构的可行性之后[4,6-11],本文提出并设计了一种基于双DSP结构的硬件处理平台,快速实现手势定位及特征提取,从而成功开发了一种简便实用、容易操作及性价比高的动态手势红外遥控。
1 系统总体方案
系统基于双DSP C2000系列芯片结构的硬件平台,采用流水线处理结构,结合图像帧差法实现手势背景分离,通过图像滤波、灰度直方图等方法实现手势定位及特征提取。双DSP两级流水线的图像处理流程,保证了系统动态手势图像处理的流畅和实时性,再集成红外控制模块,实现了手势识别技术和红外遥控技术的结合,从而实现动态手势红外遥控。设计的动态手势红外遥控系统总体方案如图1所示。系统主要由DSP1前级处理、DSP2后级处理、红外控制模块三大部分组成,其中DSP1和DSP2均为TI公司C2000系列芯片中的TMS320F2812信号处理芯片系统,系统采用两级流水线的系统处理方法,DSP1负责与图像传感器通信,实时采集图像数据,并对图像进行初步的图像滤波处理。DSP2主要负责实时图像的后级处理,包括手势背景分离、手势特征提取、手势动作识别、指令判断以及与红外控制模块的通信。系统的红外控制模块具有收发一体功能,能够自定义学习红外指令以适应各种遥控对象。
手势识别算法主要包括:手势图像预处理、手势背景分离、特征提取和动作识别。系统基于帧差法实现手部图像分割方法就是对视频图像序列中的相邻的或一定时间间隔的两帧进行逐个像素比较,来获得前后两帧图像亮度差的绝对值。利用间隔短暂时间的两帧图像比较,可以得到两张图像运动方向的边缘围成的一小段白色区域。用这段白色区域代替手部位置。帧差法能够消除大部分的背景,并且经过帧差法处理之后图像中的噪声类型单一,容易用特定的滤波算法消除[7,12]。对帧间差分法得到的图像按选定的阈值进行二值化,得到目标图像序列的二值化图像序列Fk(x,y)。其中,
2.1 图像采集模块
为了实现手势图像的实时采集,本系统采用了一款以OV7620图像传感芯片为核心的型号为C3188的数字图像传感模组作为图像采集摄像头,同时为了与DSP1的工作速度匹配,图像采集电路使用了型号为AL422B的FIFO缓冲存储芯片。图像数据采集电路示意图如图3所示。OV7620是Omni Vision公司生产的一款高集成度的高分辨率逐行/隔行扫描CMOS数字彩色/黑白视频摄像芯片。芯片输出视频的同时提供了3根同步信号线,分别为场同步信号VSN,奇偶场同步信号FODD,行同步信号HREF和像素输出时钟PCLK。使用DSP的GPIO控制4根信号线,就可以完整读取视频图像数据。
2.2 双DSP硬件结构
为了使得最大工作频率只有150 MHz的DSP F2812芯片能够进行有效快速的图像处理工作,结合实际考虑,本系统独立设计了基于双DSP F2812芯片的并行处理电路[10-11],系统电路示意图如图4所示。双DSP芯片通过双端口RAM CY7C028存储芯片建立数据通道,从而实现将手势识别图像处理分离为流水线般的处理模式,使得双DSP配合工作,前级DSP1进行图像的采集与预处理,后级DSP2同时地进行手势图像特征提取及识别等工作。这样可以大大提高单DSP的工作效率,从而可以胜任复杂的手势识别的图像处理工作。
3 软件设计
系统软件的编写包括两方面,一是DSP1端的控制程序,主要为图像采集和图像预处理;二是DSP2端的控制程序,主要为手势分割、特征提取、动作识别、红外控制程序。DSP芯片处理实现必要的图像算法之外,还包括相应外部控制模块的驱动控制程序。DSP1端的模块控制程序部分主要包括OV7620摄像头模块的数据读写程序、RTL8019AS网络芯片的控制程序。DSP2端的模块控制程序部分为HXD019控制程序。根据各模块的时序图建立相应的时序算法即可实现对各模块的控制。DSP端软件流程简图如图6所示。
4 测试实验
利用自主设计的基于DSP C2000系列芯片搭建的双DSP处理平台,根据并行流水处理的思想,实现了基于机器视觉的动态手势红外遥控系统的研制,图7为手势分割及定位效果图。
由表1可知,手与系统距离在2 m位置,系统的手势识别率达到最高,高达88.75%以上。在距离小于2 m或大于2 m位置,手势识别率都有所下降。通过实验测试,可以得到本系统性能参数,如表2所示。从表2可以看出,一次动作的最短识别时间为1 s,识别速度虽然相对较慢,但考虑到红外遥控的应用实际,本系统仍然具有实用价值。
动态手势交互实现需要多方面技术和算法的综合,其优化也是多方面的,包括手势图像采集、图像预处理、手势背景分离、特征提取和动作识别等。本系统使用双DSP结构可达到资源合理分配和快速并行处理的目的,节省了单DSP需要等待的时间,加快了动态图像处理的速度,从而实现了基于动态手势交互的红外遥控功能。测试结果表明,系统一次手势动作的最短识别时间为1.5 s,动作识别的准确率达到93.75%,具有良好的稳定性和可操作性,可应用于电视机遥控、空调遥控和灯光遥控等家用设备的控制系统中。该系统简易实用,在满足用户手势红外遥控基本操作的同时,具有一定的趣味性和临场感,给用户带来了新一代手势交互的新体验。基于双DSP结构的处理平台,采用流水线式的算法实现结构,能将复杂的算法任务进行逐步分解,同步处理,从而加快复杂任务的处理速度。在手势识别应用方面,即使总体上系统仍有很大的改进和提升空间,但这是一次新尝试。随着手势识别等复杂应用任务被广泛关注,双DSP结构的流水线处理思路可以为同行提供一个新的参考。
参考文献
[1] WALDHERR S, ROMERO R, THRUN S. A gesture based interface for human-robot interaction[J]. Autonomous Robots, 2000,9(2):151-173.
[2] TRIESCH J, MALSBURG C. Robotic gesture recognition[C]. In Gesture Workshop,1997,233-244.
[3] STENGER B, WOODLEY T, CIPOLLA R. A Vision-Based Remote Control[M]. Computer Vision: Recognition, Registration and Reconstruction, Springer, 2010.
[4] Shi Lei, Wang Yangsheng, Li Jituo. A real time vision-based hand gestures recognition System[J]. Advances In Computation and Intelligence, 2010,6382:349-358.
[5] 曾翔,王贤秋.电视机手势遥控系统设计[J].电视技术,2011,35(1):42-44.
[6] 赵永嘉,戴树岭.基于点分布模型的可变形手势跟踪方法[J].系统仿真学报,2009(S1):1-5.
[7] 任海兵,祝远新,徐光祐,等.复杂背景下的手势分割与识别[J].自动化学报,2002(2):256-261.
[8] VIBLIS M K, KYRIAKOPOULOS K J. Gesture recognition: the gesture segmentation problem[J]. Journal of Intelligent & Robotic Systems, 2000,28(1-2):151-158.
[9] IWAI Y, HATA T, YACHIDA M. Gesture recognition from image motion based on subspace method and hidden Markov model[C]. International conference on Intertlipent Robots and Systems,1997,2:960-966.
[10] 黎玉刚,张英敏,付强文.双口RAM在组合导航系统中的应用[J].电子技术应用,2005(9):75-78.
[11] 李超,姜戎,罗传勇,等.基于双DSP的飞艇组合导航系统设计[J].计算机工程,2007(17):259-261.
[12] 刘俊梅,阮秋琦.一种复杂背景下的手势分割新方法[J].北京电子科技学院学报,2006,14(2):23-27.