C/C++数据对齐总结

C/C++数据对齐总结

这里用两句话总结数据对齐的原则：

（1）对于n字节的元素（n=2,4,8,...）,它的首地址能被n整除，才能获得最好的性能；

（2）假设len为结构体中长度最长的变量，size为CPU(处理器)的位数，对齐规则：

若len < size,则以len为单位对齐
若len >= size,则以size为单位对齐

这里不考虑指定对齐方式的情况。

测试

struct B{
bool i;
int j;
bool k;
};

struct A{
int j;
bool i;
bool k;
};

cout<<sizeof(B)<<endl;
cout<<sizeof(A)<<endl;

输出结果： 12 8

理解起来也不难，一般情况下，地址总线总是按照对齐后的地址来访问，例如你想得到0x0000 0001开始的4字节内容，系统首先要以0x0000 0000开始，获得一个4字节，然后从中去除三字节，接着又以0x0000 0004开始，取出一个四字节，然后取出一字节，两次组合你想得到的内容，然而如果初始地址一开始就是0x0000
0000那么就只要一次就行了。所以对于B来说，按四字节对齐假设i的地址是0x0000 0000 那么为了一次取出j那么j的地址必须为0x0000 0004,由于四字节对齐k也要占四字节。而A中假设j的地址是0x0000 0000,那么i为0x0000 0004很合理，且当k地址为0x0000 0002时同样可以一次取出，所以一共8字节。

对于sizeof有个需要注意的地方：

struct C{
int a;
static int b;
};
cout<<sizeof(C)<<endl；

结果：4

解释：因为静态变量是存放在全局区，而sizeof计算栈中分配的大小，是不会计算在内的，所有结果为4.

C/C++数据对齐总结

时间： 2024-12-16 19:12:12

C/C++数据对齐总结的相关文章

gpu显存（全局内存）在使用时数据对齐的问题

全局存储器,即普通的显存,整个网格中的任意线程都能读写全局存储器的任意位置. 存取延时为400-600 clock cycles 非常容易成为性能瓶颈. 访问显存时,读取和存储必须对齐,宽度为4Byte.如果没有正确的对齐,读写将被编译器拆分为多次操作,降低访存性能. 多个warp的读写操作如果能够满足合并访问,则多次访存操作会被合并成一次完成.合并访问的条件,1.0和1.1的设备要求较严格,1.2及更高能力的设备上放宽了合并访问的条件. 1.2及其更高能力的设备支持对8 bit.16 bit

erlang shell表格数据对齐

最近在erlang shell做一些测试,为了让测试结果数据显得更直观,想对齐需要打印的数据,做成像表格一样的效果. 开始的想法是在数据中插入tab.当然,erlang也有对tab的支持,但实际效果不理想. 对tab的支持如下: 1> io:format("No1~sNo2~n1~s2~n", ["\t", "\t"]). No1 No2 1 2 ok 但数据的长度超过8个字符就有问题,那有没有一种可以

sizeof数据对齐问题

#include <iostream> using namespace std; struct A1 { int a; static int b; }; struct A2 { int a; char c; }; struct A3 { float a; char c; }; struct A4 { float a; int b; char c; }; struct A5 { double d; float a; int b; char c; }; void main() { cout<

Ultra Edit中的数据对齐

有时会用到Ultra Edit的数据对齐功能.比如,要求64个符号一组,从低位开始对齐.这时,如果数据长度不是一行长度的整数, 就会产生高位对齐.低位不足的问题.为了调整,往往需要逐行调整,很不方便. 有一个优化的方法,先计算数据长度除以"行长度"的余数,然后在数据首位前补足零,以保证整除.之后自动对齐,没有低位不足的问题.

gcc 数据对齐之：总结篇.

通过上面的分析,总结结构体对齐规则如下: 1.数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员自身长度中,比较小的那个进行.2.结构(或联合)的整体对齐规则:在数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中,比较小的那个进行.3.结合1.2颗推断:当#pragma p

数据对齐总结

必须注意:对齐是多少字节对齐,不是多少位对齐. 对齐原因: 如上图片,内存一般是四个单位一列,CPU在读取内存数据的时候,通过总线并行读取每个单位的数据.对于CPU 32bit的寄存器而言. 0-7bit是来自于内存芯片0的位 8-15bit是来自内存芯片1的位 16-23bit是来自芯片2 24-31来自芯片3 而内存结构是,内存地址一个单位也就是基本单位是1字节,也就是8位二进制数. 在读取数据的时候实际上是0-7位从芯片0读取,8到15位从芯片2读取,以此类推. 所以读取一个4字节数据,是

内存中的数据对齐

数据对齐,是指数据所在的内存地址必须是该数据长度的整数倍.DWORD数据的内存起始地址能被4除尽,WORD数据的内存起始地址能被2除尽.x86 CPU能直接访问对齐的数据,当它试图访问一个未对齐的数据时,会在内部进行一系列的调整.这些调整对于程序来说是透明的,但是会降低运行速度,所以编译器在编译程序时会尽量保证数据对齐.同样一段代码,我们来看看用VC.Dev C++和LCC这3个不同的编译器编译出来的程序的执行结果: 这是用VC编译后的执行结果: 变量在内存中的顺序:b(1字节)-a(4字节)-

C/C++数据对齐汇总

C/C++数据对齐汇总这里用两句话总结数据对齐的原则: (1)对于n字节的元素(n=2,4,8,...),它的首地址能被n整除,才干获得最好的性能: (2)如果len为结构体中长度最长的变量,size为CPU(处理器)的位数,对齐规则: 若len < size,则以len为单位对齐若len >= size,则以size为单位对齐这里不考虑指定对齐方式的情况. 測试 struct B{ bool i; int j; bool k; }; struct A{ int j; bool i; b

数据对齐与代码优化笔记

1. 一直以来对数据对齐都不明白,直到看了这篇文章后才能说是有点感觉,结合代码将理解写下来,以备将来回头加深理解或者是修正错误的认知. http://www.searchtb.com/2013/04/performance_optimization_tips.html 代码如下,运行的环境是64位的linux机器,内核3.10,gcc 4.8.2 /*************************************************************************

gcc数据对齐之: howto 2.

原文链接:http://www.catb.org/esr/structure-packing/ 谁应阅读本文本文探讨如何通过手工重新打包C结构体声明,来减小内存空间占用.你需要掌握基本的C语言知识,以理解本文所讲述的内容. 如果你在内存容量受限的嵌入式系统中写程序,或者编写操作系统内核代码,就有必要了解这项技术.如果数据集巨大,应用时常逼近内存极限,这项技术会有所帮助.倘若你非常非常关心如何最大限度地减少处理器缓存段(cache-line)未命中情况的发生,这项技术也有所裨益. 最后,理解这项

猜你喜欢

已完成的布局

<LinearLayout android:id="@+id/linearLayout1" android:layout_width="fill_par ...

关于并行配置不正确，应用程序无法启动的问题

这二天的一个软件发布后,在自己的电脑与测试电脑上和虚拟机上运行都没有问题,当弄了一台新电脑,准备安装好软件,给客户用时,出现"应用程序无法启动,应用程序的并行配置不正确". 这回有 ...

使用JavaScript·求数组的最大值和最小值

前言在数组中并没有提供arr.max()和arr.min()这样的方法.那么是不是可以通过别的方式实现类似这样的方法呢?那么今天我们就来整理取出数组中最大值和最小值的一些方法. 法一:其实利用 E ...

OC 内存管理:MRC与ARC

内存中的五大区域: 栈区,堆区,BBS段,数据段和代码段,其中除了堆区以外,其他区域的内存管理由系统自行回收 OC对象是存储在堆区的,所以OC的内存管理主要是对”堆区中的OC对象”进行管理内存管理中 ...

关于数据源跟事件封装实例

#import <UIKit/UIKit.h> @class XWDropdownMenu; #pragma mark 数据源方法 @protocol XWDropdownMenuData ...

在exsi6.0中安装debian8.1 64位无界面服务器版.

之前介绍了exsi6.0的安装. 现在开始应用. 上一篇介绍的exsi6.0是安装在U盘上的系统.U盘为群联芯片,芯片型号为2251-50/30.容量为2G.发现容量足够用.比较节省成本. 现在开始为 ...

MySql之centos7.2安装mysql5.7.13

一.MySQL 5.7主要特性: 原生支持Systemd更好的性能:对于多核CPU.固态硬盘.锁有着更好的优化更好的InnoDB存储引擎更为健壮的复制功能:复制带来了数据完全不丢失的方案,传统金融客户 ...

分布式系统的那些事儿（三） - MQ时代的通信

之前在讲RPC通信的各种好处,特别好用,但是RPC并不是万能的,也并不是适用于各种场景的,因为他是同步的:现如今很多场景下的调用都是异步的,系统A调用B后,并不需要知道B的结果,而且对B的结果无所谓, ...

[转载] 站内消息DB设计思路

[转载]:点击打开链接原文标题:两年后,再议“站内信”的实现注:仅因为在工作中用到相似的东西,故借鉴作者的文章,如有不便请告知,即刻删除两年前,万仓一黍在博客园发了两篇关于站内信的设计实现博 ...

Oracle表联结之嵌套循环

1.单表访问: 分表,分区,建索引,全表扫描---开并行, 永远把它放内存,压缩 2.多表关联,任何时刻只能是2个表关联,得到的结果集再和其他表关联. 3.嵌套循环:Oracle从较小结果集(驱动表 ...

与IT技术相关的微信公众号

(1)作为一个IT从业人员,必须关注最新的技术动态每天及时充电,不然很容易就会被淘汰 (2)但是互联网的信息量太大,过于离散,好的内容好的经验往往被掩埋在不为人知的角落. 因此,本人决定在写博客之余, ...

高可用集群原理解析

HA(High Avaliablity,高可用)集群的出现是为了使集群的整体服务尽可能可用,从而减少由计算机硬件和软件易错性所带来的损失.如果某个节点失效,它的备援节点将在几秒钟的时间内接管它的职责 ...

软件过程与项目管理之描述软件2

软件有很多种,也有各种分类办法: ShrinkWrap (在包装盒子里面的软件,软件在CD/DVD上): Web APP (基于网页的软件): Internal Software (企业或学校 ...

开源，互联网和商业模式

前几天我行文解释了开源和互联网其实是伴生关系,没有互联网传播,开源不会以星星之火的方式最终燎原.同样,没有开源的技术支持,互联网也不会这么快地颠覆着一切. 所以,开源和互联网一样,本质上是通过信息的透 ...

[hdu5136]Yue Fei's Battle 2014 亚洲区域赛广州赛区J题(dp)

转载请注明出处: http://www.cnblogs.com/fraud/ ——by fraud 现场赛的时候由于有个地方有点小问题,没有成功AC,导致与金牌失之交臂. 由于今天下 ...

重定向syste.out.print

PrintStream ps;try { ps = new PrintStream("D:\\role.txt"); System.setOut(ps); ...

git fetch 命令

git fetch命令用于从另一个存储库下载对象和引用. 使用语法 git fetch [<options>] [<repository> [<refspec>-] ...

回溯法解决八皇问题

把八个皇后放在一个8*8的棋盘上面,要求同一行.同一列.同一对角线不能有两个皇后. 思路:关键在于判定两个皇后是否在同一行.同一列或同一对角线上.这里,棋盘下标从1开始算起.观察发现:若是在同一行,则 ...

ubuntu下安装wine1.8和阿里旺旺

参考:http://www.linuxidc.com/Linux/2015-12/126722.htm和http://www.linuxidc.com/Linux/2016-05/131131.htm ...

JAVA修改excel的内容

package com.bestpay.bpbp.bill.init; /** * Created by Qj on 2015/08/17. */ import jxl.Workbook; impor ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.