kaiyun官方注册
您所在的位置: 首页> 可编程逻辑> 业界动态> 高性能与低功耗:FPGA上可以实现鱼与熊掌兼得

高性能与低功耗:FPGA上可以实现鱼与熊掌兼得

----Altera SOPC World 2008侧记
2008-10-31
作者:深圳市创意时代

金秋的十月,Altera SOPC World 2008分别在深圳、杭州、北京召开,三站上千名工程师参加了这一探讨“高性能" title="高性能">高性能与低功耗" title="低功耗">低功耗设计”的技术盛宴。本届Altera SOPC World 2008,Altera不但抢先披露了将今年年底提供工程样片的新的40-nm Stratix IV FPGA一些细节,更和合作伙伴一起发布了有关利用FPGA实现高性能与低功耗设计的方案,并探讨了Cyclone III FPGA和MAX IIZ CPLD一些最新应用。本届Altera SOPC World 2008传达了这样的信息:FPGA领域,高性能和低功耗是可以实现鱼和熊掌兼得的。

会场座无虚席

FPGA与全球金融危机中的本土公司发展

“在这次席卷全球的金融风暴中,中国不可能独善其身,面对金融风暴,本土制造企业要做的就是利用核心知识产权来创新。”Altera中国区销售经理钟屹在深圳站的致辞中指出,“我们本土企业中华为、中兴和迈瑞是三家利用独有知识产权创新的典范,本土企业可以利用这次机会,在逆境中前进。”

具体到企业的运营,他指出本土企业首先要做的就是用最小的成本实现最大的收益,另外就是要了解如何提升企业的生产率,如何去实现创新。而这三点又恰恰和FPGA有关,他强调Altera为助力本土企业实现上述目标提供了所需的高中低所有产品,12月Altera 40nm Stratix? IV将面市,会给客户带来更多创新的功能和设计。

作为本土创新的典范之一,中兴通讯天线研究院BBU研发中心算法部部长张睿在深圳站上结合中兴通讯的实际介绍了自主知识创新的体会和对未来技术演进的预测,他指出,“中兴在标准和专利领域非常活跃,目前专利申请总数14800余项,90%以上为发明专利申请,国际专利申请超过1100项,此外中兴还加入50多个国际标准化组织,牵头、参与制定的国家、行业标准和企业标准900多项,参与率90%!”

他强调,目前电信运营商最关注如何降低总拥有成TCO(total cost of ownership)。要满足运营商这些需求,就需要在基站的站点数量、低功耗设计、升级成本、土建成本等方面节约成本,而落实到基站设计上,就是要实现高集成高效率基站设计。例如GSM从传统的单密度到双密度、四密度,多载波进一步提高基站集成度,单机柜从支持6载频到18、36载频等。这样就促使CPU、DSP、FPGA、ASIC放弃原来独立演进的路线,逐步发展为互相渗透式的“融合和高集成”式演进,例如DSP向多核发展,并融合ASIC,而FPGA开始集成软核和硬核" title="硬核">硬核并取代ASIC部分功能,这样发展下去,“SoC会终结这个趋势吗?。”他提出了这样的问题。

什么样的FPGA可以成为SoC终结者吗?

就像要回答他的疑问,Altera亚太区副总裁兼董事总理Erhaan Shaikh在题为《多处理技术提高性能、降低功耗" title="降低功耗">降低功耗》的演讲中指出未来电子应用不但需要更有效地电源管理,更需要高性能,为了满足这个双重的需要,业界需要更灵活的技术,而FPGA是理想的解决方案。

移动通信和互联网极大地丰富并方便了我们的生活,但是,这样的便利带来了是能源的消耗加剧。他举例说目前一个柴油发电基站每年需要消耗5238加仑柴油,以每加仑4美元计算,消耗的柴油就超过2万美元。但是,全球互联网带宽消耗却是每年在快速增加,迫使需要投入更多的电信设备,现在产业已经达成共识,就是利用多核体系来应对性能提升需求。Intel CEO曾经勾画了未来处理器的雏形,它“单个芯片中有数十亿个晶体管、可配置电路模块、所有层次上实现并行、专用低功耗引擎实现实时信号处理、大规模高速全局可配置存储器、与现有软件兼容......”

Erhaan Shaikh指出现在有一个器件可以吻合这个构想中的处理器,它有“23亿个晶体管、700万可配置逻辑门、所有层次上实现并行、嵌入式DSP实现748GMACS计算性能、超过1000个的I/O管脚实现组内和组之间可以高速连接、可配置片内存储器高达22Mb,36Tbps带宽,可以利用标准HDL设计和综合”,这就是即将面市的Stratix IV EP4SGX530 FPGA!与Intel的Tukwila相比,它真正实现了高性能与低功耗――拥有25亿个晶体管的Stratix? IV功耗只有10到20瓦!而同等性能的Intel Tukwila功耗达130到170瓦!

Stratix IV大揭秘:如何兼得高性能与低功耗

Erhaan Shaikh对Stratix IV的描述无疑勾起与会者对其性能的猜想,这到底是一款什么样的FPGA?Altera南中国区工程应用经理郭晶和 Altera资深应用工程师花小勇为大家揭开了Stratix IV神秘的面纱。

1、Stratix IV性能指标揭秘

Stratix IV是密度最大的FPGA,它有高达680K的LE,有高达22.4Mbits的内部RAM拥有1,360个18 x 18乘法器!它有最大的带宽,32个收发器" title="收发器">收发器,工作在600Mbps和8.5 Gbps 之间,另外16个收发器模块,工作在600Mbps和3.2 Gbps 之间,有320Gbps全双工贷款以及优异的信号完整性。花小勇指出:“Altera在Stratix? IV上实现了收发器创新,并增强了功能,例如有可配置的第五和第六全双工通道,通道绑定最多为24个通道,支持SFI-5和HyperTransport3.0协议,而且收发器设置、数据速率和洗衣运行时间都是可重新配置的。”

他指出动态可重新配置不需要额外的软件开销并减少线卡开销,因此可以帮助系统商降低成本。

在收发器中,jitter和信号完整性是关键指标,在Stratix IV中,抖动指标符合PCI Express、CEI-6和SONET/SDH指标,并有余量,并内置预加重和均衡,可驱动6.375Gbps的50英寸FR-4背板。

花小勇特别指出目前只有Altera提供即插即用的信号完整性,当PVT变化时,可以监视并优化接收均衡。

Stratix IV的另一大特色是提供大量经过预验证的复杂IP硬核模块,包括X8、X4、X2、X1 PCI Express2.0规范兼容内核,集成TL、DLL、PHY/MAC和收发器等,“这些硬核可以省下40k的逻辑单元,而且因为这些硬核不用编译,所以可以不考虑时序限制。”他指出。

花小勇指出Stratix IV也有最好的存储器接口,实现了1067Mbps/533MHz的DDR3智能接口模块,可以具有PVT自动校准功能。此外,Stratix? IV的动态片内端接可以节省1瓦的功耗(72I/F),它还有丰富的存储器带宽支持416Gbps(333MHz)、463Gbps(400MHz)、556Gbps(533MHz)等新一代应用。

除了有出色的DSP性能以及强大的嵌入式处理器,Stratix IV另一个重要特点是采用了优化的机构体系,其自适应逻辑模块(ALU)可以在更短时间完成逻辑操作。花小勇指出FPGA个更关注功效的概念,就是每瓦功率达到的最大性能,单方面追求性能最大化没有实际意义,利用Altera的可编程功耗技术可以将非关键路径的功耗降低,实现功效最大化。与同类级别的FPGA相比,Stratix IV不但性能出众,而且功耗降低很多。

2、Stratix IV低功耗技术解密

那么,Stratix IV是如何实现高性能下的低功耗呢?郭晶指出Altera通过六大技术降低了FPGA的功耗,这六大技术是:

  • 使用高级工艺,并进行功耗优化;
  • 可编程功耗和加速电路;
  • 降低供电电压(Stratix IV的内核电压降低到0.9 V);
  • 硬核知识产权(IP);
  • 降低电感和电容(LC)的设计方法;
  • 封装技术。

而在功耗和性能优化方面,实际是贯穿了从工艺到IC设计、IC开发、系统开发的整个流程。如下图所示。在工艺技术方面的优化,不是简单地将65nm升级到40nm,实际上牵涉到更多技术,例如在工艺技术方面就采用了硅片搀杂、三次门氧化、电压供电电平、金属互联等技术。

实际上,在Stratix IV中,还采用了称为应变硅的工艺技术,它的好处是电子和空穴移动能力提高了30%,泄漏功率不变,速度提高约30%。速度不变,Ioff降低约50倍!

值得一提的是Stratix III中的可编程功耗技术仍应用在Stratix IV中,它和Quartus II软件 的PowerPlay功耗分析功能一起,可以大幅度降低FPGA的动态功耗和静态功耗。可编程功耗技术不是将没有使用的资源关断。在具体实现中,Quartus软件会决定哪些电路(晶体管)应处在高速(HS)模式和低功耗(LP)模式。通过调整背向偏置电压来改变阈值电压,减小非关键时序通路上的晶体管泄漏 (提高阈值电压),从而在需要的地方降低功耗,提高性能。

可编程功耗技术是内置在Stratix III器件芯片中的体系结构创新,当某些电路不需要高性能时,Quartus II软件可以改变晶体管阈值电压来控制功耗 (通过每一电路域的余量来确定)。这是除了关断Stratix III FPGA中未使用资源(例如,时钟树)的另一方法。

“这是Altera独有的技术,并获得了专利。不需要用户参与。由Quartus软件在每个设计中自动完成。”花晓勇特别指出。

在设计中,所有未使用的逻辑也被设置为低功耗模式。通过使用低功耗逻辑,静态功耗降低了70%。Quartus II根据用户时序约束,将每个逻辑单元自动设置为高速或者低功耗模式。这没有改变用户的开发流程。

Stratix IV其他降低功耗的技术有Stratix III中使用的动态片内匹配(OCT)技术,其不同之处在于动态接通/关断,这对通用总线接口特别有用,例如DDR等。在存储器写期间(FPGA输出缓冲驱动存储器芯片),接通串联电阻,匹配走线阻抗,关断并行匹配终端,降低功耗。在存储器读期间(存储器芯片驱动FPGA输入缓冲),可以匹配传输线。当缓冲在输入和输出之间切换时,Stratix IV自动完成这一过程,反之亦然。

另外,Stratix IV采用了大量的硬核IP来降低功耗,而且不消耗设计中的编译资源。

不过,他指出,最有效降低功耗的还是Altera 的Hardcopy技术,它可以将布线功耗降低95%、逻辑减小80-90%、RAM减小35-65%!

Cyclone III FPGA和MAX II也有高性能与低功耗

郭晶强调,Altera已经全面将低功耗技术应用到高中低所有器件系列上,在Cyclone III FPGA和MAX II上也同样实现了高性能与低功耗。下图就显示了Altera在Cyclone III上采用的低功耗工艺技术。

当然,在MAX II上也有类似的技术,MAX IIZ CPLD静态功耗降低到29微安,动态功耗也只有8.9毫安。在这次大会上,Altera的合作伙伴Echelon公司介绍了基于Altera CycloneIII低成本控制网络方案。这些方案应用在商业、工业和消费领域,不但性能可靠,也完全实现了低功耗低成本的目标。其他合作伙伴则展示了基于Altera的电信、安防、汽车电子解决方案等。

此外,Altera行销产品经理张洵瑜还介绍了MAX IIZ在模拟应用的案例,她指出,CPLD除了完成逻辑功能外,还可以应用在模拟电路中,例如可以利用MAX II上拉电阻来测量电容,不需要外部元件。采用MAX II还可以完成触摸开关应用、阻性触摸屏、容性触摸屏、辐射和亮度测量、LED闪烁控制等需要模拟器件完成的设计。

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306116;邮箱:aet@chinaaet.com。
Baidu
map