kaiyun官方注册
您所在的位置: 首页> 嵌入式技术> 设计应用> 基于DSP的H.264运动估计算法研究
基于DSP的H.264运动估计算法研究
来源:微型机与应用2013年第3期
郭明松,张丽晖,周劲蕾,蔺吉虹,陈 芬
(宁波大学 信息科学与工程学院,浙江 宁波 315211)
摘要:采用基于TI公司高性能Davinci系列TMS320DM6437处理器的SEED-DEC6437 EVM板作为主要硬件平台,在DSP开发环境CCS3.3中采用C语言和汇编语言混合编程实现运动估计算法的DSP移植,并加入人机接口,使用DSP/BIOS调度多个任务,从而实现了从软件平台到硬件平台的移植,成功搭建了一个基于运动估计算法的DSP应用系统。研究结果表明,使用DSP平台可以使得运动估计算法的实时性更好。
Abstract:
Key words :

摘 要:采用基于TI公司高性能Davinci系列TMS320DM6437处理器的SEED-DEC6437EVM板作为主要硬件平台,在DSP开发环境CCS3.3中采用C语言和汇编语言混合编程实现运动估计算法的DSP移植,并加入人机接口,使用DSP/BIOS调度多个任务,从而实现了从软件平台到硬件平台的移植,成功搭建了一个基于运动估计算法的DSP应用系统。研究结果表明,使用DSP平台可以使得运动估计算法的实时性更好。
关键词:H.264;运动估计算法;数字信号处理器;TMS320DM6437

 随着信息技术的发展,21世纪被形象地称为信息时代、数字时代、多媒体时代。多媒体信息主要包括文字、声音、图像、图形和视频等内容,其中,视频又是多媒体信息中最重要的组成部分。无论是存储还是传输,数字视频都必须经过极大的压缩才具有实际意义,这就使得视频压缩技术成为多媒体技术的关键所在。目前最优秀的视频编码标准是H.264,但是它的优异性能是以巨大的运算量为代价的,这其中运动估计就占了70%,因此,对运动估计算法的研究具有很大的实用价值。
 运动估计是视频编码中的一项核心技术, 能有效去除序列图像的帧间冗余从而实现高效编码。它利用在同一场景中相邻两幅图像具有的时域相关性,在参考帧中搜索当前块的最佳匹配块并计算两块的相对位移量,即运动矢量。当前有很多经典的运动估计算法,如全搜索算法、三步搜索算法3SS(Three Step Search)、菱形搜索算法DS(Diamond Search)和六边形搜索算法HEXBS(Hexa-gon Based Search)等。本文主要研究三步搜索算法在DSP平台上的移植,并加入人机接口,设计一个基于运动估计算法的DSP应用系统。
 基于DSP实现该算法有以下优势:(1)用户开发自由度更大,支持多种个性化开发,可以满足市场不断提出的新的要求,在第一时间提升产品性能,增强产品的竞争能力;(2)DSP处理能力强,可以在一个DSP上同时实现多路音视频信号的压缩处理,还可提供很多视频专用功能,如视频滤波、高分辨显示输出和OSD等;(3)外围接口丰富,开发周期短,可实现快速技术更新和产品换代;(4)芯片功耗低,为提高产品的稳定性提供可靠保障。
1 基于运动估计算法的DSP应用系统总体设计
 本文用SEED-DEC6437开发板、摄像头和液晶显示器等搭建了硬件平台,在其上实现对采集的实时视频的相邻两帧进行运动估计,在参考帧中找到最佳匹配块并计算出相应的运动矢量,同时加入人机接口,通过用户按键,灵活地切换到不同的工作模式。系统流程图如图1所示。

 整个系统的数据流程为:首先从CCD摄像头采集PAL制式模拟视频信号,通过视频解码芯片TVP5150将模拟信号解码成YCbCr422格式的数字图像信号[1],并通过数据总线将数据存储至DDR2,TMS320DM6437通过访问DDR2进行视频数据的相应处理。在本系统中,数据处理过程主要在于实现运动估计算法,通过CCS3.3软件中的Watch Window查看计算出的运动矢量。
2 基于SEED-DEC6437视频回路设计
 在进行运动估计之前,首先要在SEED-DEC6437开发板上搭建视频回路,该回路包括视频输入模块、算法处理模块和视频输出模块3部分。SEED-DEC6437开发板上的TMS320DM6437处理器中集成的视频处理子系统(VPSS)包含视频处理前端(VPFE)[2]和视频处理后端(VPBE)[3]。VPFE用于视频输入,可以连接PAL标准模拟视频输入信号,也可以连接数字视频输入信号。
2.1 系统的视频输入模块设计
 系统视频输入是利用解码芯片TVP5150将模拟信号解码成YCbCr422格式的数字图像信号,再送入TMS320DM6437进行相应的图像处理。TVP5150是一款高性能的视频解码芯片,可以将PAL制式的视频信号或NTSC制式的视频信号转换成YCbCr422格式的数字信号。TMS320DM6437与TVP5150的连接框图如图2所示,在SEED-DEC6437开发板上接一路复合视频输入。

 TVP5150实时输出的视频图像数据为符合ITU-R BT.656标准的YCbCr 4:2:2数字视频图像数据,其特点是,每个像素点具有自己单独的亮度信息Y,但是每两个相邻的像素共用同一组色度数据Cb和Cr。
2.2 系统的视频输出模块设计
 TMS320DM6437视频输出是利用内置的VPSS的视频输出编码模块(VENC)中4路10 bit的DAC输出,实现CVBS与VGA的输出。其中,CVBS输出接口使用了其中1路DAC,VGA输出接口使用了共3路的DAC。本系统在设计过程中主要采用以composite复合信号的形式来进行最终实时图像的输出显示。其视频输出连接示意图如图3所示。

3 系统的运动估计算法设计
3.1 H.264编码器框架

 图4为H.264编码器的主体结构。其中,Fn为当前欲编码的帧,它是以宏块为单位进行编码处理的,每个宏块是以帧内或帧间模式进行编码。Fn-1是指前面已解码的多个参考帧,在帧间模式下,宏块根据参考帧Fn-1进行运动估计ME(Motion Estimation)和运动补偿(Motion Compensation)得到预测值P,预测值与当前帧Fn得到残差值,再对该残差值进行变换编码T与量化Q,得到变换量化系数;最后经墒编码输出到网络提取层NAL(Network Abstraction Layer)。Fn′为经过滤波得到的重构图像,它将被放入参考帧存储器作为下一帧或几帧编码的参考帧之一。其中,运动估计是基础,也是运算量最大的部分。

3.2 运动估计算法的DSP移植
 运动估计的基本思想是将图像序列的每一帧分成许多互不重叠的宏块,并认为宏块内所有像素的位移量都相同,然后对于当前帧中的每一块的前一帧或后一帧在某一给定搜索范围内,根据一定的匹配准则找出与当前块最相似的块,即匹配块由匹配块与当前块的相对位置计算出运动位移,所得的运动位移即为当前块的运动矢量。
 基于块匹配的运动估计可以从块的模式选择、块匹配准则和搜索策略3个方面进行研究。

 经过三步搜索算法搜索到最佳匹配块后,将当前帧的当前块的坐标与最佳匹配块坐标相减,得到运动矢量。本文对8×8的块进行搜索,第1步中步长取4,第2步中步长取2,第3步中步长取1,搜索结果如图6所示。其中,temp为一个含9个元素的一维数组,存放9个点的SAD值;mvx和mvy为SAD值最小点的坐标,通过该坐标可以计算出相应的运动矢量。

 本文以SEED-DEC6437开发板为核心硬件,成功搭建了视频回路,并在CCS3.3环境下编写算法代码,实现了基于DSP的运动估计算法,取到了运动矢量。为了增强系统的灵活可控性和实时性,又成功加入了人机接口,成功实现了DSP/BIOS任务调度。
参考文献
[1] Wu Xiaomin, Xu Weizhang, Zhu Nanhao, et al. A fast motion estimation algorithm for H.264[C]. International Conference on Signal Acquisition and Processing, IC5AP′10, 2010: 112-116.
[2] Jing Xuan, CHAU L P. An efficient three-step search algorithm for block motion estimation[J]. IEEE Transactions on Multimedia, 2004, 6(3): 435-438.
[3] Texas Instruments Incorporated. TMS320DM6437 evaluation module(EVM)quick start installation guide[Z]. 2006.
[4] Texas Instruments Incorporated. TMS320DM643x DMP video processing front end(VPFE) user′s guide[Z]. 2008.
[5] 王亮,徐佩霞.基于DSP实时实现的H.264运动估计快速算法[J].小型微型计算机系统,2005,26(11):2025-2028.
[6] 雷琳,张俊峰,刘京,等.一种基于H.264的改进的运动估计三步搜索算法[J].计算机技术与发展,2010,20(12):1-7.
[7] 王恒,朱金秀.H.264快速运动估计算法研究[J].海大学常州分校学报,2007,21(4):24-27.
[8] 蔡自兴,蒋冬冬,谭平,等.H.264中快速运动估计算法的一种改进方案[J].计算机应用研究,2010,27(4): 1524-1529.
[9] 彭启琮.达芬奇技术——数字图像/视频信号处理新平台[M].北京:电子工业出版社,2008.

此内容为AET网站原创,未经授权禁止转载。
Baidu
map