1、引言
近年来,导航领域对高性能运算及信号处理的要求越来越高。对目前大多数基于VME总线的并行多处理器系统而言,总线带宽已经成为制约系统处理能力的瓶颈。VME64X的总线带宽为320Mb/s,已经不能满足要求高吞吐量、低延迟的系统,迫切需要一种新的运算架构来满足实时高性能的导航和信号处理需求。PICMG协会在ATCA构架的基础上提出了一种MicroTCA构架。
2、AdvancedTCA构架
ATCA(advanced telecom computing architecture)高级电信计算构架采用点对点交换互连结构以实现高速数据传输$接口信道建立在LVDS(低压差分信号)差分对基础之上,电气特性达到3.125GHz,数据编码使用8b/10b编码机制。交换互连拓扑结构分为:双星型、双-双星型和全网状。
ATCA构架能够实现6.25Gbit/s的速率,高达2.5Tbps的总带宽,支持热插拔和冗余备份,99.999%的可靠性,每板高达200W的散热功率。此外还支持不同通讯协议之间的互连,包括以太网和光纤传输、InfiniBand、RapidIO、PCI Express等。
由于成本较高,占用空间大,设备管理和冷却供电复杂,以及必须使用载板来容纳AMC模块,使得ATCA构架适用于大规模、集中式的电信应用。
3、MicroTCA构架
3.1MicroTCA主要标准
兼容ATCA、AMC.0规范;可裁减的成本、尺寸以及模块;模块化的设计;可扩展的背板带宽,1~40Gb/s;300mm、19英寸可上架机箱,支持高级系统管理;每个AMC模块20~80W的散热;支持-40℃~+65℃的温度范围;可靠性99.9%~99.999%;最低8年的使用寿命;支持星型、双星型和全网状拓扑结构;支持热插拔。
3.2 MicroTCA系统构成
1个典型的MicroTCA系统包括:12块AMC模块、1个或2个MCH(MicroTCA Carrier Hub)、互连背板以及电源、散热等模块(见图1)。MicroTCA系统支持AMC.0的所有规格的板卡。MCH是MicroTCA系统的主要组成部分之一,功能类似于载板,以容纳AMC模块。作为载板集中器,MCH能够同时进行12个AMC模块之间的互连和管理。
图1 MicroTCA系统架构
4、AMC构架
AMC是新一代扩展卡的规范,支持热插拔,支持高速互连,支持丰富的处理器构架,主要面向于通信和嵌入式领域,同时具有低成本和模块化的灵活配置。
AMC模块是MicroTCA系统的重要组成部分,通过对AMC模块的使用能很容易地实现系统扩展、模块化设计,从而方便地实现各种系统功能。AMC模块包括CPU、DSP模块、网络处理器(NPU)、存储模块以及各种各样的I/O模块。
MicroTCA系统支持如图2所示的6种尺寸的AMC模块。
图2 AMC模块的规格
不同尺寸的AMC模块能够容纳的器件是不同的,并且都有自己潜在的应用范围。用户可以根据自己的应用领域灵活地选择相应的模块。
5、MicroTCA信号处理机
采用如图3所示的MicroTCA双冗余构架构造了一套信号处理机。
该系统主要由CPU控制板、DSP信号处理板、网络通信板、数据采集板(A/D、D/A)、存储模块和机箱构成。
AMC处理器模块采用英国并行公司的PR AMC/33x,该处理器配备2.0GHz Intel Pentium M处理器,支持PCI Express x8(AMC.1)、2个千兆以太网(AMC.2)、2个串行ATA150(AMC.3)。具有强大的处理能力和高速的数据传输。
信号处理模块(AMC DSP)采用Surf公司的DSP模块SurfRider AMC板,单板可最多容纳8颗TI C6455 DSP,板载FPGA管理接口通信。
存储模块采用Kontron公司的AM4500,最大120GB的存储量。兼容AMC.3规范。
网络模块采用Kontron公司的AM4300,带4个10/100/1000Mb自适应以太网接口,支持PCI Express x8、x4、x2、x1链路。兼容AMC.2规范。
MicroTCA机箱采用德国Rittal公司的3U 14槽19英寸可上架机箱。
图3信号处理机结构图
通过AM4300可同时将4路千兆网络数据引入系统,通过背板互连将数据送入SurfRider模块进行DSP处理,同时可将数据送入AMC4500进行同步存储。处理器AMC模块PR AMC/33x负责整个系统的协调调度。该系统可运行VxWorks及Linux等主流操作系统,还支持Vxworks进行实时信号处理。
5.1 硬件设计
系统的硬件结构设计见图4。整个系统采用MicroTCA并行构架,由信号处理模块、数据采集模块、网络通信模块、存储模块和控制器模块构成。各模块之间通过AMC规范定义的各种高速总线进行互连。本系统中包括Serial RapidIO、Fiber Channel、Ethernet、PCI Express。
图4 系统结构图
信号处理模块由两块DSP多处理器板构成。从功能上划分,用第一片DSP处理板C6455完成速度补偿以及抗异步干扰模块、脉冲压缩模块的功能;用第二片C6455完成动目标处理模块、非相参积累模块、杂波图以及恒虚警检测(CFAR)模块及点迹提取模块的功能。两板之间通过Serial RapidIO进行数据通信。峰值速率高达3.125GBps。
每块处理板包含8颗TI DSP定点处理器C6455,主频高达1GHz,每DSP带32M DDR2 DRAM,运算节点之间通过共享内存提高系统通信能力。单颗DSP运算能力达8000 MIPS,每块信号处理板运算能力高达64000 MIPS。8颗C6455之间也通过RapidIO进行连接构成并行处理系统。存储模块和采集模块完成导航数据的高速采集和实时存储。DSP信号处理板硬件构架见图5。
图5 信号处理板构架
5.2 软件设计
信号处理以及实时成像对运算量和实时性要求很高,往往无法由单颗DSP完成。本系统的硬件架构可以对系统中的任一片或几片DSP模块进行相应功能的编程,多个模块组成的并行处理系统保证实时的数字信号处理能力。用本系统进行脉冲压缩时,采用串行处理方法,将数字脉压的卷积过程转化成三步运算,即先将输入信号进行傅立叶变换,再乘上与输入信号相匹配的滤波系数,将乘积进行逆傅立叶变换,最终得到脉冲压缩结果。于是,可将处理任务分解成三个流水处理过程:(1)FFT;(2)复数乘法;(3)IFFT。即将信号的卷积实现从(1)式到(3)式的变换。
y(n)=x(n)*h(n) (1)
式中x(n)为输入信号,h(n)为匹配滤波系数,用FFT法实现数字脉压,即完成:
y(n)=IFFT(X(jω)·H(jω)) (2)
y(n)=IFFT(FFT(X(n))·FFT(h(n))) (3)
按照算法的数据流走向分别分配给相应的DSP芯片完成FFT、复乘和逆FFT,采用这样的串行处理%能够把数据在一个包内处理并传送至下一流程,无需考虑数据的等待和拼合,处理流程加快,程序容易编制。
6、结论
文中构建的基于MicroTCA构架的DSP并行处理导航系统,克服了传统VME、CPCI总线系统带宽方面的不足,先进的构架支持RapidIO、PCI Express、Fiber Channel以及Ethernet等高速总线的背板互连.系统的信号处理能力可以通过增加信号处理板很容易地进行扩张。该系统运行稳定,处理能力强,带宽高,实时性好且支持-40℃~+65℃的温度范围。随着MicroTCA构架被PICMG制定为标准发布,MicroTCA构架将会更多地应用于地面导航、雷达成像等领域。