为低功耗、高性能通用FPGA树立行业“新标杆”
2021-09-07
来源:莱迪思
为了强化Nexus系列产品的领先地位,莱迪思在过去的18个月内推出了四款基于Nexus技术平台的产品,包括主攻嵌入式视频应用的CrossLink-NX、经过重新定义的通用FPGA Certus-NX、第二代安全FPGA Mach-NX、高级通用FPGA CertusPro-NX,以及预计将于2022年推出的同样基于FD-SOI平台的两款新品。
Nexus平台代表了低功耗FPGA技术在近十年内最重要的更新。作为Nexus家族的最新成员,CertusPro-NX主要是为了满足智能系统中的数据协同处理、5G通信基础设施中的高带宽信号桥接、以及ADAS系统中的传感器接口桥接等创新应用需要而推出的,并在功耗设计、系统带宽、边缘处理、可靠性、封装多样性等多个方面得到了进一步提升。
之所以选择这样的设计思路,是因为从当前的行业发展趋势来看,网络边缘设备的智能化程度正在大幅提高,它们一方面需要更高的接口带宽以便于快速传输数据,另一方面又需要更多小尺寸的系统集成和便于优化散热管理的低功耗方案。
“新标杆”的成色
与竞品相比,CertusPro-NX最大的特点在于它专为网络边缘处理进行了优化,不仅拥有行业领先的能耗效率和可靠性,还在超小的封装尺寸中提供了行业最佳的系统带宽,且是同类产品中唯一支持LPDDR4外部存储器的FPGA产品。
通过利用莱迪思在FPGA架构方面的创新和28nm低功耗FD-SOI制造工艺,CertusPro-NX器件的功耗比同类竞品FPGA低四倍。通过改变基底的偏压,开发人员可以自由选择采用高性能(HP)还是低功耗(LP)模式运行。
但功耗并非是Nexus平台的唯一优势。像CertusPro-NX这样的Nexus系列器件通常在其他方面也优于相似的竞品,包括数据处理性能、系统带宽、存储密度和对器件小尺寸的支持。
CertusPro-NX FPGA支持多达8个可编程SERDES通道,速度高达10.3Gbps,提供同类产品中最高的系统带宽(是同类竞品FPGA的两倍之多),并支持主流的通信和显示接口,如10 Gigabit Ethernet、PCI Express、SLVS-EC、CoaXPress和DisplayPort。
同时,为满足网络边缘AI和机器学习应用对稳定的数据协处理的需求,CertusPro-NX FPGA支持多达100K逻辑单元,是目前所有基于Nexus的FPGA中逻辑密度最高的器件,其片上存储器容量也比同类其他FPGA高出约65%,是目前唯一支持LPDDR4 DRAM存储标准的低功耗FPGA。此外,CertusPro-NX在可编程架构基础上还增加了超高效的DSP模块,以及小型和大型内部存储器模块,用于支持人工智能和机器学习应用中的低延迟数据处理。
CertusPro-NX FPGA的设计面积仅为81mm2,比竞品器件小6.5倍,例如拥有相同逻辑单元的Xilinx Artix-7 100K LC的尺寸面积为529mm2,是CertusPro-NX的6.5倍;而尺寸面积为121mm2的Intel Cyclone V GT 77K LC,逻辑单元仅有77K。这样的小尺寸设计对于工业摄像头或通信系统中使用SFP模块的开发人员来说,是一个关键的设计考虑因素。
此外,考虑到汽车、工业和通信领域的关键型应用必须有高的可靠性,实现可预测的性能并确保用户安全,莱迪思将CertusPro-NX器件抗软错误能力提高了100倍,并可在-40℃至125℃的结温范围内正常工作。这意味着,CertusPro-NX FPGA能够以合理的商业成本为下一代通信、嵌入式、工业和汽车应用带来极高的可靠性,帮助系统时刻保持在线,保障最终用户的安全。
全新的FPGA产品包括CPNX-50K和CPNX-100K两个型号,分别拥有52K和96K的逻辑单元数量,传统的EBR(嵌入式memory)和大型RAM分别达到3.7Mb和3.6Mb,18×18 DSP与PLL数量最高可达156个和4个,并支持10GE PCS、PCIe Gen 3、SGMII CDR、ADC等硬核模块。
与此同时,易于使用的Lattice Radiant设计软件的最新版本现已推出。除了支持CertusPro-NX FPGA之外,Radiant 3.0在整个设计流程中优化了信号可追溯性,让开发人员能够更轻松地在HDL源代码和RTL视图以及技术视图之间追踪验证信号。新版本可以让用户在莱迪思综合引擎(LSE)和Synplify Pro综合引擎之间进行选择,提高了设计灵活性。在Radiant 3.0中,时序分析与其他操作分开,因此可以独立运行时序分析。设计人员可以在设计中探索不同的“假设”场景,无需重新运行映射和布局布线,这极大地加快了迭代设计过程。
开辟主流FPGA的新天地
CertusPro-NX FPGA将于2022年第二季度量产发货,首发器件为CPNX-100K,截至目前,客户样片和抢先体验软件已经发布。结合莱迪思sensAI、mVision、Automate一系列解决方案,CertusPro-NX将在网络边缘AI、嵌入式视觉系统及自动化工厂建设等方面取得广泛应用。
l机器视觉和网络边缘AI
除了拓展CertusPro-NX的可编程逻辑架构外,莱迪思还强化了该平台的AI功能。凭借7.3 Mb的内部存储器,客户可以加载轻量化的神经网络来识别物体、监听关键词或检测异常行为。然而硬件只是设计的一方面。莱迪思sensAI软件集合能与Caffe、TensorFlow、TensorFlow Lite和Keras等框架配合使用,且拥有莱迪思AI编译器的支持。这一经过验证的解决方案集合为众多莱迪思客户提供了功耗和资源效率充分优化的人工智能应用。该软件平台与公司的多款FPGA兼容(CertusPro-NX的兼容性计划于今年晚些时候推出)。
网络边缘的机器视觉应用不仅要求使用硬件来实现神经网络,还需要传感器兼容、传感器聚合和图像预处理等功能。在这方面,莱迪思通过可编程I/O和SERDES模块来为CertusPro-NX的客户提供足够的灵活性。例如,许多高清图像传感器都采用SLVS-EC接口,这是许多网络边缘AI加速器所缺少的;可编程SERDES还支持各种将数据从网络边缘传输到系统内部的标准,包括CoaXPress和10G Ethernet。
由于DRAM操作会增加功耗并降低吞吐量,所以如果所有权重都存储在芯片上,神经网络就能以最佳状态运行,且能够最大限度地减少DRAM访问。因此,客户希望拥有更大的片上存储器。莱迪思全新FPGA可以存储多达100万个8位权重--几乎是Cyclone V GT或Artix-7的两倍。由于芯片内部可以存储更多的权重,CertusPro-NX可以在不访问DRAM的情况下运行更大的AI模型,从而降低功耗。
如果CertusPro-NX确实需要访问DRAM时会使用可编程I/O模块,它支持LPDDR4和速度达1066Mbps的DDR3存储器。坦率地说,支持LPDDR4会增加芯片和系统的功耗,但由于CertusPro-NX有着更大的片上存储器和优化的存储器控制器,它可以通过使用片上和外部存储器,减少存储器访问时间来达到更低的功耗,从而解除了这种担忧。
l工业物联网
最新一代工业物联网的特点就是大规模自动化,这得益于互连和数据分析方面的进步。为实现自动化分拣和包装等任务,智能工厂需要数千台物联网设备,它们每天共生成和处理的数据量达TB级。驱动这些设备的芯片必须尺寸小、功耗低且可靠性高。为了让客户为工业4.0做好充分准备,莱迪思在其最新一代FPGA中采用了以上原则。
与基于28nm Bulk CMOS工艺的FPGA竞品相比,采用FD-SOI工艺制造的CertusPro-NX漏电流最多可降低75%,而漏电流是产生静态功耗和待机功耗的主要原因。以设计需要65K逻辑单元、使用75%DSP和存储器资源、运行两个5Gbps SERDES通道,在85℃结温和125MHz频率下运行的方案而言,CertusPro-NX的总功耗(动态+静态)比Artix-7少75%,比Cyclone V GT少65%。
与英特尔和赛灵思的同类FPGA相比,莱迪思FPGA的功耗降低65-75%(数据来源:莱迪思)
得益于此,CertusPro-NX拥有了更多的低功耗和散热空间,从而帮助OEM厂商缩减系统尺寸,降低散热管理成本。例如在工业马达在运行期间,热量会在马达中积聚并提高FPGA周围的环境温度。与竞品相比,莱迪思的低功耗解决方案能让FPGA控制更高扭矩的马达而不会过热。
与Artix-7相比,CertusPro-NX可降低99%的软错误数量,平均故障间隔时间(MTBF)是Artix-7的110倍,且无需使用软错误检测逻辑和纠错代码,这些均来自FD-SOI所拥有的消除单粒子翻转(SEU)错误的额外优势,汽车、医疗、工业机器人等行业将因此获益良多。
l5G应用
在5G应用中,考虑到5G基站空间狭小,数据流动量大,功耗比4G基站高70%等因素,基站OEM厂商往往需要FPGA来协助增强处理器或ASIC芯片,因为前者具备更高的效率。
CertusPro-NX在拥有SERDES功能的同类芯片产品尺寸最小,功耗低于Artix-7和Cyclone V GT,能够简化基站的散热管理,非常适合小尺寸设计,且数据速率不会受到限制。如图所示,CertusPro-NX拥有的75Gbps SERDES带宽比Artix-7高36%,是Cyclone V GT的2倍以上,对于数据包管理等高带宽功能,CertusPro-NX可提供更高的吞吐量、面积和效率。
CertusPro-NX的SERDES总带宽超过竞品2倍之多,在数据密集型操作方面有着显著优势。(数据来源:莱迪思)
结语
CertusPro-NX是莱迪思为“主流FPGA”市场注入的新活力。多年来,这一重要领域投资较少,主要竞争对手在过去十年中甚至都没有发布任何一款新的低成本架构产品,因此CertusPro-NX有机会通过PCIe Gen3和LPDDR4等新技术来巩固其最新产品系列的市场地位,更好地服务于5G基站、工业物联网和机器视觉等新兴市场。