gcc/linux内核中likely、unlikely和__attribute__(section(""))属性

查看linux内核源码,你会发现有很多if (likely(""))...及if (unlikely(""))...语句,这些语句其实是编译器的一种优化方式,具体分析如下:

likely及unlikely是一个宏定义:

#define likely(x)  __builtin_expect(!!(x), 1)

#define unlikely(x)  __builtin_expect(!!(x), 0)

likely()的 意思是认为这个分支最有可能发生,如if (likely(x == 0)){...},这个语句表示x等于0最有可能发生,其实语意就相当于if (x == 0){...},只不过likely针

对程序指令运行做了优化,不去做一些无谓的指令跳转;unlikely()意思相反,就是最不可能发生,注意if (unlikely(x == 0))还是相当于if (x==0)的逻辑。

如果需要更进一步了解likely()就必须要深入了解__bulitin_expect(!!(x), 1)函数。

— Built-in Function: long __builtin_expect (long exp, long c)

    You may use __builtin_expect to provide the compiler with branch prediction information. In general, you should prefer to use actual profile feedback for this (-fprofile-arcs), as programmers are notoriously bad at predicting how their programs actually perform.   However, there are applications in which this data is hard to collect.

    The return value is the value of exp, which should be an integral expression. The semantics of the built-in are that it is expected that exp == c. For example:

              if (__builtin_expect (x, 0))
                foo ();

    indicates that we do not expect to call foo, since we expect x to be zero. Since you are limited to integral expressions for exp, you should use constructions such as

              if (__builtin_expect (ptr != NULL, 1))
                foo (*ptr);

    when testing pointer or floating-point values.

文档链接:https://gcc.gnu.org/onlinedocs/gcc/Other-Builtins.html#Other-Builtins

从gcc官方文档来看,内建函数long __builtin_expect (long exp, long c)主要用于优化程序的分支预测,减少程序的指令跳转,现代处理器一般都是流水线架构,

很多芯片级的优化是靠流水线预取完成的,所以我们的程序优化也是需要尽量减少跳转。

文档也提到了由于大部分程序员根本就不了解自己程序的运行情况,所以推荐我们在编译时加上-fprofile-arcs选项去评估我们的程序分支运行情况;-fprofile-arcs选

项是代码覆盖率测试工具gcov使用时需要增加的编译选项,gcov能够去统计及分析我们的程序的分支运行情况,关于gcov的使用这里不做介绍,只需要知道gcov是

一个测试统计工具,配合-fprofile-arcs工具使用,__builtin_expect 根据gcov的分析结果来做实际的分支预测优化。

这里可以大家还会有疑问,为什么#define likely(x)  __builtin_expect(!!(x), 1)中要使用!!(x),这其实是因为函数__builtin_expect (long exp, long c)期望是exp == c,这时的1相当于bool值true,所以exp需要是一个bool表达式,通过!!可以变成bool表达式而不改变原有函数,这样才能够正确的与1或0(bool值)做匹配判断;试想如果没有!!,即#define likely(x)  __builtin_expect((x), 1),那么likely(10)原本是希望表达式是true,但是根据函数的处理逻辑10 != 1,那么优化会以false的结果来优化,这样就阴差阳错了!!!

最后讲述一下__attribute__(section(""))属性,这个属性比较好理解,就是为某个函数或变量指定section,比如:

int __attribute__(section(".test.data")) value = 0;

这样的话变量value将会被放在.test.data段中;

void __attribute__((section(".test.text"))) func(void){}

这样函数func会被放入.test.text段中。

查看section信息可以通过如下命令:readelf -S xxx,可以查看可执行文件也可以是目标文件.o,关于section这里不过多介绍,只要大概知道一般我们的代码都是放在.text段,全局变量一般放在.data段,我们通过__attribute__((""))定义的符号就放在我们特定的section里面。

时间: 2024-12-18 21:13:42

gcc/linux内核中likely、unlikely和__attribute__(section(""))属性的相关文章

Linux 内核中的 GCC 特性

转载:http://www.ibm.com/developerworks/cn/linux/l-gcc-hacks/?S_TACT=105AGX52&S_CMP=tec-csdn Linux 内核中的 GCC 特性 了解用于 C 语言的 GCC 扩展 Linux? 内核使用 GNU Compiler Collection (GCC) 套件的几个特殊功能.这些功能包括提供快捷方式和简化以及向编译器提供优化提示等等.了解这些特殊的 GCC 特性,学习如何在 Linux 内核中使用它们. 0 评论:

[翻译] Linux 内核中的位数组和位操作

Linux 内核里的数据结构 [TOC] 原文链接与说明 https://github.com/0xAX/linux-insides/blob/master/DataStructures/bitmap.md 本翻译文档原文选题自 Linux中国 ,翻译文档版权归属 Linux中国 所有 Linux 内核中的位数组和位操作 除了不同的基于链式和树的数据结构以外,Linux 内核也为位数组或位图提供了 API.位数组在 Linux 内核里被广泛使用,并且在以下的源代码文件中包含了与这样的结构搭配使用

第01节:Linux 内核中的 C 语言语法扩展

1.1 Linux 内核驱动中的奇怪语法 大家在看一些 GNU 开源软件,或者阅读 Linux 内核.驱动源码时会发现,在 Linux 内核源码中,有大量的 C 程序看起来"怪怪的".说它是C语言吧,貌似又跟教材中的写法不太一样:说它不是 C 语言呢,但是这些程序确确实实是在一个 C 文件中.此时,你肯定怀疑你看到的是一个"假的 C 语言"! 比如,下面的宏定义: #define mult_frac(x, numer, denom)( { typeof(x) quo

Linux内核中的jiffies及其作用介绍及jiffies等相关函数详解

在LINUX的时钟中断中涉及至二个全局变量一个是xtime,它是timeval数据结构变量,另一个则是jiffies,首先看timeval结构struct timeval{time_t tv_sec; /***second***/susecond_t tv_usec;/***microsecond***/}到底microsecond是毫秒还是微秒?? 1秒=1000毫秒(3个零),1秒=1000 000微秒(6个零),1秒=1000 000 000纳秒(9个零),1秒=1000 000 000

Linux内核中的Cache段

原文地址:http://blogold.chinaunix.net/u2/85263/showart_1743693.html 最近移植LEON3的内核时,了解了一些简单知识,特提出来供大家分享. 我们知道Linux 内核包含很多Section段,例如主要的.text段,.data段等等.但另外还有一种段,其可以在内核加载时自动存放到相应平台的Cache中,以方便被快速读取,该Section的名称为以下两种: .data.cacheline_aligned    .data.read_mostl

Linux内核中双向链表的经典实现

Linux内核中双向链表的经典实现 概要 前面一章"介绍双向链表并给出了C/C++/Java三种实现",本章继续对双向链表进行探讨,介绍的内容是Linux内核中双向链表的经典实现和用法.其中,也会涉及到Linux内核中非常常用的两个经典宏定义offsetof和container_of.内容包括:1. Linux中的两个经典宏定义2. Linux中双向链表的经典实现 转载请注明出处:http://www.cnblogs.com/skywang12345/p/3562146.html 更多

linux内核中的宏ffs(x)【转】

转自:https://www.cnblogs.com/fengeryi/p/3449720.html linux内核中ffs(x)宏是平台相关的宏,在arm平台,该宏定义在 arch/arm/include/asm/bitops.h #define ffs(x) ({ unsigned long __t = (x); fls(__t & -__t); }) static inline int fls(int x) { int ret; if (__builtin_constant_p(x)) r

Linux内核中常用String库函数实现

//只列举了部分常用的strcpy,strcmp,strcat,strchr,strstr,strpbrk...  char *strcpy(char *dest, const char *src) { char *tmp = dest; while ((*dest++ = *src++) != '\0') /* nothing */; return tmp; } char *strncpy(char *dest, const char *src, size_t count) { char *t

route-显示并设置Linux内核中的网络路由表

route命令 网络配置 route命令用来显示并设置Linux内核中的网络路由表,route命令设置的路由主要是静态路由.要实现两个不同的子网之间的通信,需要一台连接两个网络的路由器,或者同时位于两个网络的网关来实现. 语法 route(选项)(参数) 选项 -A:设置地址类型: -C:打印将Linux核心的路由缓存: -v:详细信息模式: -n:不执行DNS反向查找,直接显示数字形式的IP地址: -e:netstat格式显示路由表: -net:到一个网络的路由表: -host:到一个主机的路