时序优化一例（二）

发表于 2011/12/29 10:45:53 阅读（15172）

在《时序优化一例（一）》中采用修改代码的方法优化了一实例，通过加入一级流水线寄存器分割组合逻辑达到该路径时序收敛，但是重新check一下timing发现还有时序不满足，而且还是除法器IP核的时序未收敛，对于这官方提供的IP核那就没办法通过修改代码进行优化了。查了些资料，发现还可以通过物理综合优化，在没有使能物理综合前，QuartusII软件只进行逻辑综合，逻辑综合中的时序仅限于综合后的门级电路或者器件内部的逻辑单元的时延信息，并没有包含布线时延信息，也就是说Synthesis与fitter并没有交互操作；而物理综合则在综合时考虑具体的布线时延信息，使获得不错的综合结果。

QuartusII提供了几个选项，可以通过Settings->Compilation Processing Settings->Physical Synthesis Optimization打开，如图1所示。

图1

其中主要分为两部分：

1. Optimize for Performance：主要用于优化性能

2. Optimize for fitting：主要用于优化fitter

与时序相关的就是第1部分（Optimize for Performance）了，翻阅了官方手册，找到了对应各选项的解释。

Perform physical synthesis for combinational logic：通过交换LEs中LUT port来减少关键路径的逻辑层数目，同时还会通过复制LUT解决扇出过大的问题，此选项只影响combinational logic，并不对register进行优化；

Perform register retiming：关于register retiming的概念，主要是为了解决关键路径逻辑过长的问题，通过在combinational logic中移动register，利用宽松路径的余量来补偿关键路径进行优化；

Perform automatic asynchronous signal pipeline：该选项是在fitter时自动加入针对异步clear或load信号的流水线级来优化性能，特别是在recovery和removal slack未达到时序要求时可以使能这一选项；

Perform register duplication：自动复制register优化高扇出的问题。

图2

针对设计，通过查看关键路径，如图2所示，发现逻辑级数达到33，这与第一个选项：Perform physical synthesis for combinational logic所能解决的问题比较匹配，使能第一个选项，看一下优化结果：

图3 优化前

如图3所示为优化前的时序波形图，时序未收敛，关键路径上Data Delay过大，达到4.335ns。

图4 优化后

如图4所示为经过优化后原先关键路径的时序波形图，发现该路径已达到收敛，Data Path的时延仅3.464ns，留给建立时间0.126ns的余量。因此选项：Perform physical synthesis for combinational logic确实达到了优化的目的，下面来查看一下软件是如何自动优化的：