时序优化实例

这个实例我们来看看如何对设计进行时序优化,假设设计的顶层框图如图1所示, 该设计在两个系统之间实现了一个POS-PHY第三层链路。

图1:POS-PHY顶层设计框图

如图所示在POS-PHY第三层接收器模块收到包之后,包检测模块分析一个包里的数据,以确保数据是正确的,比如确保包的长度是1K字,ERR标志没有被置位。接着包将会送到FFT以及一系列FIFO,外部的FIFO是为了增加系统存储能力。最后,数据包由POS-PHY第三层发送器模块发送到其它器件。

该设计总共有三个时钟域,一个是外部100MHz时钟域,一个是200MHz内部时钟域,最后一个是读写外部FIFO的133MHz时钟域。

下面我们利用这个设计来具体实践怎么发现设计中的时序问题,以及如何来解决这些时序问题。假设设计已经完成,我们下面按步骤一步一步来介绍。

由于事先我们已经将工程建立好了,我们直接对工程进行编译,然后在编译报告里找到TimeQuest时序报告,如图2所示,SCLK时钟域存在时序违规。

图2:工程编译后查看时序报告

为了查看SCLK详细时序违约情况,可以通过鼠标右击图2中第一行,从弹出的菜单里选择“Report Timing…”,如图3所示。

图3:通过报告时序命令查看时序分析细节

选择图3所示的命令后,在弹出的命令对话框中输入一下信息,然后点击“Report Timing”,如图4所示。

图4:报告SCLK时序

可以看到报告显示非常多的红色时序违规,很多时候面对这类时序问题,设计者往往会手足无措,因为不知道从哪里下手来解决这些问题。大家可以按照一些提示来进行分析:

l  找到From和To下节点,分析其类型。可以结合两个节点来分析,常常可以帮助我们理解到底哪里出了问题。比如,这两个节点是位于两个模块之间的接口还是位于一堆组合逻辑之中呢。有时候,我只需解决少量有时序问题路径,就可以同时解决一堆其它路径的时序问题。

l  找到From和To节点中你认识的节点。通过这些节点,你可以知道那些源代码或逻辑结构出现了问题。这样比较容易理解出问题的逻辑是什么以及如何来解决时序问题。

l  前面提到,当你解决某个路径的时序问题的时候,可能会不经意间解决了其它路径上的时序问题。因为编译器总是试图对所有路径进行优化,假如能通过修改代码或约束来解决某个路径的问题,那么就有利于释放编译器将更多精力放在其它有时序问题的路径上。

回到最初的时序报告,根据上述提示,不管有多少时序失败的红色路径,我首先来分析前面几行时序问题,最前面几行是时序最差的路径,如图5所示。

图5:时序最差几条路径

我们看到前面7条内容差不多,那么我们来分析第一条,鼠标右击第一行任何地方,选择“Report Worst-Case Path”来观察和分析这条路径。在Statistic页面查看这条路径的上数据到达路径上的逻辑层级,当然也可以在Data Path页面下通过该路径上CELL和IC的计数也能得知该路径上的逻辑层级,如图6所示,结果是17级。

图6:查看数据到达路径上逻辑层级

鼠标右击图6中到达路径任何单元,选择“Locate Path”,然后在弹出的对话框里选择“Technology Map Viewer”,单击OK。那么我会看到如图7所示的逻辑结构。

图7:寄存器之间逻辑层级过多

如图7所示在寄存器last_data和parity_error之间总共有17级逻辑,很好地表明了这个时序应该是由过多逻辑层级造成。

回到TimeQuest,我们再次使用“Locate Path”命令,这次选择使用Chip Planner来查看路径。在Chip Planner底部的Locate History窗口里双击定位的路径,根据需要可以使用放大镜调整放大倍数,我们可以看到这条路径布局布线结果如图8所示。

图8:布局布线结果

图8中连线的延时信息,需要从View菜单里执行“Show Delays”来使能已经高亮的路径。可以看到该路径上所有节点只分布在相邻的两个LAB中,而且LAB之间仅有少数几根连线,这表明这是一个很好的布局,再次证明该路径时序问题是由逻辑层级过多造成。

为了解决这个路径上的时序问题,可以 插入流水寄存器的方法。如果代码是你本人写的,那么这个方法是一个可行的办法。因为你会知道,发生这种奇偶校验错误时,并一定需要立即得到处理,几个时钟周期的滞后对于设计来说还是可以容忍的。所以我们可以通过修改代码来对该路径进行优化。

插入流水之前,奇偶校验是这样实现的:

assign parity0  = last_data[ 0] ^ last_data[ 1];

插入流水后,将parity赋值语句放在进程里面并使用阻塞赋值,如下所示:

parity0  <= last_data[ 0] ^ last_data[ 1] ^ last_data[ 2];

通过以上修改并重新编译设计,那么奇偶校验寄存器现在都满足了时序要求。如图9所示,剩下时序问题负的slack小于1了。

图9:剩下的有时序问题路径

从图9可以看出,时序问题仍然是SCLK时钟域,可以再次使用报告时序来对其进行分析。从报告窗口里继续使用“Report Worst-Case Path”命令来查看第一条出现时序问题的路径sop_error的更多细节。

图10:出现时序问题路径细节

如图10所示,很多出错路径的To节点都是sop_error(即包错误标志开始)信号,这些路径都是从接收模块的FIFO地址寄存器到此标志信号。这就意味着,我们可以一次性解决所有这些问题。

根据前面的经验,我首先来查看这条路径的逻辑层级,使用相同的方法,但是这次我们发现路径上逻辑层级很少,所以也许问题不是因为层级太多,但是为了验证我们的猜测,可以使用图形观察工具进行确认。使用“Locate Path”到“Technology Map Viewer”中进行观察,如图11所示。

图11:观察路径逻辑层级

从图11可以看到,不像之前那条路径,这条路径上只有一个RAM块和3级逻辑,所以证明这个时序问题不是因为路径上有过多的逻辑层级。但是可以看到RAM的输出路径是组合逻辑,这意味着整体寄存器到寄存器延时就包括RAM块以及三级组合逻辑单元的延时。这是否是造成时序违规的原因呢?

我们返回到TimeQuest中观察路径详细信息的slack报告界面,在Data Arrival Path片段,我们重点看第六行(时钟路径和数据路径已经展开,行号应该是2,因为数据路径展开在时钟路径之后)。如图12所示。

图12:详细观察数据到达路径

我们需要图12中,注意“Type”列为CELL延时,这行显示经过器件的cell给该路径增加的延时。“Location”和“Element”显示的是该CELL实际上是一个M9K存储块,那么经过这个存储块增加了多少延时呢,可以在“Incr”列看到。因此,尽管这条路径上只有少数几级逻辑,但是此路径上的时序问题还是属于逻辑层级过多造成的时序失败,因为路径经过的存储块带来过多的延时。那么我们应该如何来解决这种问题呢?通过使用M9K块输出寄存器来手动插入流水似乎是不可能的,因为该RAM是POS-PHY函数的一部分。通过多周期路径约束应该可以解决这个问题,但是多周期路径约束会增加处理延时。

这个问题,可以使用物理综合里的寄存器重定时选项来进行优化。寄存器重定时将移动关键路径上的寄存器位置来提升路径时序性能。虽然这个优化选项将会增加编译时间,但是它有可能会同时解决设计中其它的时序问题。

使能寄存器重定时,可以在Quartus II软件的Assignments菜单下选择Settings,在弹出的窗口找到物理综合优化,使能寄存器重定时优化选项,同时将其“Effort level”设置为“Extra”,点击OK后重新编译工程。

编译结束后,SCLK时钟域所有时序问题都得到了解决。

时序优化实例

时间: 2025-01-01 08:07:42

时序优化实例的相关文章

C语言优化实例:消除多级指针的间接访问

如果一个多层次的数据结构达到两级或者两级以上,举例如下: struct A{ int array_member[100]; //其他数据成员 }; struct B{ struct A *a_ptr; //其他数据成员 } 那么通过B类型的指针b_ptr访问A类型的array_member的某一个元素array_member[0]则需要使用b_ptr->a_ptr->array_member[0]这种多级指针的形式.如果一个函数中多次用到这个变量的话,可以采用一个临时变量保存这个多级指针:in

C语言优化实例:循环中减少判断

为了让编译器更好地优化循环,应该尽量让循环中减少判断,方法之一是将判断语句整合进表达式.还是这个例子: for (int i = 0; i < 1000*10; i++) { sum += data[i/1000][i%10]; } 假如我们需要加一个判断,只有非负整数才需要作求和运算: for (int i = 0; i < 1000*10; i++) { if (data[i/1000][i%10] >= 0) sum += data[i/1000][i%10]; } 下面将这个判断

关于altera fpga的io时序优化问题

chip planner中一个io的结构如下图所示 其中左边是输出部分右边是输入部分,但是会注意到两个结构:1,寄存器,2,delay模块 以下是我的推测:这两个结构是为了做时序优化时用的,在altera提供的时序优化文档中提到有快速输入输出寄存器在io cell里. 如果有正确的时序约束的话,quartus 软件是可以自动决定寄存器是放置到core里还是io cell里,但是也可以手动设置,方法是在assignment editor 里选择需要设置的管脚手动设置,如果是输入寄存器的话放到io

tomcat优化实例

优化实例 启动参数优化JAVA_OPTS='-server -Xms512m -Xmx512m -XX:PermSize=64m -XX:MaxPermSize=512m -XX:+UseBiasedLocking -XX:+AggressiveOpts -XX:+DisableExplicitGC -XX:+UseConcMarkSweepGC -XX:+DisableExplicitGC -XX:+UseParNewGC -XX:+CMSParallelRemarkEnabled -XX:+

转载 关键路径优化实例

这个实例是为了显示如何通过重组路径来对设计时序进行优化,首先我们来看原书给出的为优化的实例代码. 以下是优化之前的代码片段: module randomlogica( output reg [7:0] Out, input [7:0] A,B,C, input clk, input Cond1,Cond2); always @ (posedge clk) if (Cond1) Out<=A; else if (Cond2&&(C<8)) Out<=B; else Out&

Nginx+PHP优化实例

1.PHP-FPM高负载的解决办法 http://blog.haohtml.com/archives/11162 2.Nginx优化配置 http://blog.haohtml.com/archives/6213 3.Nging利用多核cpu提高性能_配置参数worker_cpu_affinity http://blog.csdn.net/wzy_1988/article/details/8180136

MySQL索引优化实例说明

下面分别创建三张表,并分别插入1W条简单的数据用来测试,详情如下: [1] test_a 有主键但无索引 CREATE TABLE `test_a` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT, `title` varchar(100) NOT NULL, `content` text NOT NULL, `number` int(10) unsigned NOT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB

mysql经纬度查询并且计算2KM范围内附近用户的sql查询性能优化实例教程

之前很傻很天真地以为无非就是逐个计算距离,然后比较出来就行了,然后当碰到访问用户很多,而且数据库中经纬度信息很多的时候,计算量的迅速增长,能让服务器完全傻逼掉,还是老前辈的经验比我们丰富,给了我很大的启示. MySQL性能调优 – 使用更为快速的算法进行距离计算 最近遇到了一个问题,通过不断的尝试最终将某句原本占据近1秒的查询优化到了0.01秒,效率提高了100倍. 问题是这样的,有一张存放用户居住地点经纬度信息的MySQL数据表,表结构可以简化 为:id(int),longitude(long

无线页面动画优化实例

无线页面本就分秒必争,更不用说当我们在无线页面中使用动画的时候.不管是css动画还是canvas动画,我们都需要时刻小心着,并且有必要掌握页面性能的基本分析方法. 既然我们的目标是优化,那么就与浏览器的一些渲染和执行机制有关,更好的迎合浏览器的行为方式,才可以让我们的动画流畅而优美. 没错,浏览器是老大,全听它的. 一.设备刷新率(帧率) 我们想让页面变快,想让动画流畅,我们需要先了解一下是什么在影响着我们的感知. 页面运行在设备的浏览器中,现在市面上的移动设备的刷新频率大多是60次/秒(帧率)