关于hrtimer_forward小段代码的分析【转】

转自:http://blog.csdn.net/wowuyinglingluan/article/details/45720151

版权声明:本文为博主原创文章,未经博主允许不得转载。

目录(?)[-]

  1. 整段代码
  2. 关于无效的forward
  3. 关于定时精度问题
  4. 精确调整和overrun问题
  5. 存疑

随着各种嵌入式设备上采用linux,特别是Android系统的广泛应用,linux的hrtimer高精度模式开始被广泛支持。当然,虽说可以支持到ns精度,具体实现依赖于硬件定时器和内核编译条件,不过,一般情况下,几十us的定时精度都是支持的。这给编写驱动带来了很大的方便。 
之前有一篇非常强大的博文Linux时间子系统之六:高精度定时器(HRTIMER)的原理和实现,已经将hrtimer的基本原理和hrtimer的应用方法做了清晰详尽的剖析,这里针对在应用hrtimer时,往往导致定时器没有按照设计精度执行的问题,分析一下hrtimer_forword的内部的小段代码。

整段代码

817 u64 hrtimer_forward(struct hrtimer *timer, ktime_t now, ktime_t interval)
818 {
819         u64 orun = 1;
820         ktime_t delta;
821
822         delta = ktime_sub(now, hrtimer_get_expires(timer));
823
824         if (delta.tv64 < 0)
825                 return 0;
826
827         if (interval.tv64 < timer->base->resolution.tv64)
828                 interval.tv64 = timer->base->resolution.tv64;
829
830         if (unlikely(delta.tv64 >= interval.tv64)) {
831                 s64 incr = ktime_to_ns(interval);
832
833                 orun = ktime_divns(delta, incr);
834                 hrtimer_add_expires_ns(timer, incr * orun);
835                 if (hrtimer_get_expires_tv64(timer) > now.tv64)
836                         return orun;
837                 /*
838                  * This (and the ktime_add() below) is the
839                  * correction for exact:
840                  */
841                 orun++;
842         }
843         hrtimer_add_expires(timer, interval);
844
845         return orun;
846 }

关于无效的forward

以上是3.4版本内核中的hrtimer_forward的实现,我们来分析一下这里面的几个关键环节: 
首先时给出的now,这个时间很重要,

822         delta = ktime_sub(now, hrtimer_get_expires(timer));
823
824         if (delta.tv64 < 0)
825                 return 0;

因为如上我们可以看到,如果当前时间比定时器到期时间要早,说明定时器上还有一个工作需要在当前时间完成,因此,不会进行任何操作。直接返回,也就是说,如果我们希望这次hrtimer_forward起作用,那么实际上,不会起任何作用。

关于定时精度问题

接下来看看定时精度,如果我们看一下针对某一嵌入式系统的linux源码中hrtimer的实现,我们就会看到,良好的实现均准确地设置了resolution,这个resolution是定时器能够实现的最高精度,当然这一般不是硬件决定的(一个主频48Mhz的MCU,其硬件定时器的定时精度都在20ns),而是嵌入式系统设计者根据系统的整体性能考虑权衡的结果。

827         if (interval.tv64 < timer->base->resolution.tv64)
828                 interval.tv64 = timer->base->resolution.tv64;

因此我们看到,如果我们给出的interval如果比这个精度要高,那么,我们只能得到最短等于该精度的定时。

精确调整和overrun问题

接下去的代码,还有点儿让对gcc不太了解的人糊涂,就是

830         if (unlikely(delta.tv64 >= interval.tv64)) {

这句话的关节在于unlikely宏,其实这是在提醒gcc编译器,一般情况下,delta.tv64 >= interval.tv64的条件按是不成立的,这可以让gcc编译出更加高效的代码。并不影响if内部的判断,我们可以直接理解为:

if (delta.tv64 >= interval.tv64) {

而在这个条件为真的时候,会对expires作较为精密的外科手术。delta是一个由于hrtimer自身遍历以及我们callback函数内部的业务处理,耗费了一定时间,已经超过了 interval,那么则认为出现了overrun现象,即下一次定时已经被覆盖掉了。这时,内核希望做一些补救工作,不过也做不了多少,就是告诉你按照你给出interval,已经超时了几次了,并且看看是否可以根据这个来微调后续的定时时间。这里的代码挺有意思,我们连起来看一下

/*这是delta怎么来的*/
822         delta = ktime_sub(now, hrtimer_get_expires(timer));
831                 s64 incr = ktime_to_ns(interval);
832 /*这是一个将当前的expires加上detal所能包含的interval整数倍的时间的计算
833                 orun = ktime_divns(delta, incr);
834                 hrtimer_add_expires_ns(timer, incr * orun);

那么,如果hrtimer的处理,是在硬件中断上的原子性操作,且ktime_divns只是简单的整数除法,以下的代码绝对不可能成立:

835                 if (hrtimer_get_expires_tv64(timer) > now.tv64)
836                         return orun;

那么,实际上,它是一个通过损失精度来完成计算的除法,如果除数大于32位,那么除数与被除数一起损失精度到除数小于等于32位为止,以下是其函数定义:

u64 ktime_divns(const ktime_t kt, s64 div)
313 {
314         u64 dclc;
315         int sft = 0;
316
317         dclc = ktime_to_ns(kt);
318         /* Make sure the divisor is less than 2^32: */
319         while (div >> 32) {
320                 sft++;
321                 div >>= 1;
322         }
323         dclc >>= sft;
324         do_div(dclc, (unsigned long) div);
325
326         return dclc;
327 }

因此,如果inteval是一个大于2^32的大数的时候,还真有可能让条件成立滴^_^。这是返回值和加载expires上的值都对,没有什么要讲的了。 
如果不成立,则

841                 orun++;
842         }
843         hrtimer_add_expires(timer, interval);

存疑

那么在这样的一个状态下,很不幸,expires被加上了(incr * orun+interval)这么多的时间,我们可以理解为,此时,内核认为你希望得到的定时时间为interval给定定时时间的整数倍,然后你还知道有几次overrun,这个主意不坏,但是我们带入实际的数值,就会感觉比较好玩了。 
假设: 
delta=5ns,interval=4ns 
则: 
行833计算结果:orrun=1 
行834在原expires上加上了4ns 
那么,由于行835此时条件不会为真那么在: 
行841,orrun变成了2 
然后在行843,expires的值加上了4ns 
至此,expires一共加上了8ns,如果所有其他操作瞬间完成的话,将在3ns后得到下一次callback的机会。 
如果按照这样的逻辑,我们看到返回的结果凌乱了,明明overrun了一次,结果会返回2。如果我没有理解错误的话,此时的overrun不能反应实际的情况了

时间: 2024-08-11 09:49:57

关于hrtimer_forward小段代码的分析【转】的相关文章

小程序商城开发小程序系统代码编程分析

小程序商城开发小程序系统代码编程分析:151.1222.4001(微/电)微信小程序开发,小程序商城开发,小程序模式开发,小程序源码开发,小程序软件开发,小程序应用开发,小程序微商城搭建,小程序分销返利系统开发,小程序购物商城开发. 微信小程序1月9日发布以来,其实就是一个基于微信运行一个程序,腾讯未来就会把微信作为一个移动端OS,在微信基础上运营一个企业的小程序,这样方便用户使用程序,不需要下载和安装,这样方便了用户使用,从而我个人认为会对一些功能比较小的APP造成很大的冲击,但是对功能相对比

timeit模块 - 度量小段代码片的执行时间

官方文档: https://docs.python.org/2/library/timeit.html 源代码片: Lib/timeit.py 该模块提供了简单的方式来测量小段Python代码片.它有两种执行方式:命令行接口执行方式 和 Python程序代码可调的函数的方式. 该模块避免了很多常见的度量时间的陷进.可以参考由O'Reilly出版的Python Cookbook里面介绍算法章节. 1. 基本的例子 下面例子可以展示如果使用Command-Line Interface比较三种不同的表

js中闭包来实现bind函数的一段代码的分析

今天研究了一下bind函数,发现apply和call还可以有这样的妙用,顺便巩固复习了闭包. 1 var first_object = { 2 num: 42 3 }; 4 var second_object = { 5 num: 24 6 }; 7 function multiply(mult) { 8 return this.num * mult; 9 } 10 Function.prototype.bind = function(obj) { 11 var method = this, 1

悠然乱弹:从一段代码讲开去

序言 今天偶然看到一框架,在框架的里面有一段这样的描述: xxx并不愿意其他人来直接修改YYY框架的代码,因为XXX致力于将它打造为完美的作品,其他人写的代码,实在没有加入进来的意义. 但是您可以当小白鼠,提意见,提bug,好的idea我还是愿意接受的. 这里解释一下,其中xxx是作者名字,YYY是框架名称,这么OSC上牛人众多,牛到这个程度的还是第一次见到,于是就想去速度学习一下.其实框架好不好,看例子代码就可以看出一二,去找了找,果然找到了示例代码,我摘了两个方法: /** * 发布文章 *

当程序员说“这代码写的可真烂”,他们的意思是“这烂代码不是我写的”。而当他们说这段代码有些“小问题”时,很可能这代码是他们自己写的

英文原文:What Programmers Say vs. What They Mean 你是否听到过同事说“这段代码不言自明”?你的同事的这句话的实际意思是这段代码不需要写注释. 你也许注意到了,很多时候,程序员所说的话的字面意思和其真实的意思是完全不同的.不用惊异,下面你将很快知道这些暧昧的短语和其深层次的意思都是什么. 最近 Imgur 上出现了一张图片,里面列举的程序员的一些专业术语和其含义,它能很好的帮助你理解这些话的真实意思.这里是对其中的精华进行的总结. 典型的程序员之间的对话 当

用GetTickCount()计算一段代码执行耗费的时间的小例子

var aNow,aThen,aTime:Longint; begin aThen := GetTickCount(); Sleep(1000);//代码段 aNow := GetTickCount(); aTime := aNow-aThen; ShowMessage(IntToStr(a)); end; 用GetTickCount()计算一段代码执行耗费的时间的小例子,布布扣,bubuko.com

关于s5pv210主Makefile部分代码的分析和小的修改

$(obj)/include/config.mk  指的就是 uboot/include/config.mk ARCH = arm   CPU = s5pc11x   BOARD = x210 VENDOR = samsung   SOC = s5pc110 OBJS = cpu/$(CPU)/start.o   OBJS = cpu/s5pc11x/start.o LIBBOARD = board/$(BOARDDIR)/lib$(BOARD).a lib$(BOARD).a 等价于 libx

HashMap的小总结 + 源码分析

一.HashMap的原理 所谓Map,就是关联数组,存的是键值对--key&value. 实现一个简单的Map,你也许会直接用两个LIst,一个存key,一个存value.然后做查询或者get的时候,就遍历key的list,然后返回相应的value. 这样时间复杂度显然就是线性的,但这在map中已经是效率最低的get的方法了.而Hash主要提高效率的,也就是在这个位置--key的定位和查询这. 在数据结构中,我们学了hash这一技术,也就是散列表的技术.我们把整个表格看作是许多许多的空桶,然后散

viewpager 自动无限循环 这段代码移到你的程序中就可以用了

本程序需要懂得viewpager的基础知识,也就是说你能够自己写出一个手动滑动的viewpager,下面我将附带加小圆点的知识 那么我们回顾一下图片轮转的基础知识,如果你已经对viewpager很熟悉了就不用看了,浪费时间 1.viewpager是在v4兼容报里面的,使用控件时请带上报名 2.数据来源用list存放,我这里用的是textview做的小圆点list<textview>,layout做的单张幻灯片list<view>,将xml文件inflate成为view,View.i