SylixOS ARM平台下的内存对齐访问

1.内存对齐
1.1 内存对齐概要
现代计算机中内存空间都是按照byte划分的,从理论上讲对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内存地址访问,这就需要各类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。

1.2 内存对齐作用和原因
各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台的要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为 32位)如果存放在偶地址开始的地方,那么一个读周期就可以读出,而如果存放在奇地址开始的地方,就可能会需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该int数据。显然在读取效率上下降很多。这也是空间和时间的博弈。

2.ARM平台下内存对齐
在ARM中,有ARM和Thumb两种指令。ARM指令:每执行一条指令,PC的值加4个字节(32bits),一次访问4字节内容,该字节的起始地址必须是4字节对齐的位置上,即地址的低两位为bits[0b00],也就是说地址必须是4的倍数。Thumb指令:每执行一条指令,PC的值加2个字节(16bits),一次访问2字节内容,该字节的起始地址必须是2字节对齐的位置上,即地址的低两位为bits[0b0],也就是说地址必须是2的倍数。

遵循以上方式叫对齐(aligned)存储访问操作,不遵守这样方式称为非对齐(unaligned)存储访问操作。SylixOS下的ARM平台遵守对齐方式。

ARM平台下由于内存对齐产生的问题,如程序清单 2.1,是一段由于ARM平台下遵守内存对齐访问产生问题的代码,代码是一个简单的宏定义将VAL值赋值到DATA地址上。在程序中我们无法保证传进的参数DATA是4的整数倍,所以导致了会出现内存访问异常的现象。程序在运行中出现地址访问错误后退出。

程序清单2.1 平台下问题代码

#define EC_WRITE_U32(DATA, VAL) \

    do {
        *((uint32_t *) (DATA)) = cpu_to_le32((uint32_t) (VAL));
} while (0)      

3.ARM平台下解决方案
上述问题可以修改应用层代码去避免此类问题。如程序清单3.1,我们定义宏如果不是X86平台,直接将uint32_t内存地址强制转换成uint8_t地址,再将数据VAL强制拆分成4个uint8_t型数据分别赋值到对应的uint8_t内存地址上。
程序清单3.1 ARM平台下避免字节对齐访问

#ifdef X86_PLATFORM

#define EC_WRITE_U32(DATA, VAL) \

do { \

       *((uint32_t *) (DATA)) = cpu_to_le32((uint32_t) (VAL));
    } while (0)

#else

#define EC_WRITE_U32(DATA, VAL) \

do { \

      *((uint8_t *) (DATA)) = (cpu_to_le32((uint32_t) (VAL))) & 0xff

       *(((uint8_t *) (DATA)) + 1) =(cpu_to_le32((uint32_t)(VAL)) >> 8) & 0xff;
     *(((uint8_t *) (DATA)) + 2) = (cpu_to_le32((uint32_t) (VAL)) >> 16) & 0xff;
     *(((uint8_t *) (DATA)) + 3) = (cpu_to_le32((uint32_t) (VAL)) >> 24) & 0xff;
   } while (0)

   …

原文地址:http://blog.51cto.com/13443077/2060303

时间: 2024-08-29 20:45:32

SylixOS ARM平台下的内存对齐访问的相关文章

Windows平台下的内存泄漏检测

一,Windows平台下的内存泄漏检测 检测是否存在内存泄漏问题 Windows平台下面Visual Studio 调试器和 C 运行时 (CRT) 库为我们提供了检测和识别内存泄漏的有效方法,原理大致如下:内存分配要通过CRT在运行时实现,只要在分配内存和释放内存时分别做好记录,程序结束时对比分配内存和释放内存的记录就可以确定是不是有内存泄漏.在vs中启用内存检测的方法如下: •STEP1,在程序中包括以下语句: (#include 语句必须采用上文所示顺序. 如果更改了顺序,所使用的函数可能

Mplayer ARM平台下交叉编译

下载MPlayer http://www.mplayerhq.hu/design7/dload.html 编译环境 系统 : ubuntu 11.04 交叉编译器版本 : Sourcery G++ Lite 2009q1-203 MPlayer版本 : MPlayer-1.0rc4 ARM型号 : Cortex-A8 编译指令 ./configure --prefix=/opt/mplayer --host-cc=gcc --cc=arm-none-linux-gnueabi-gcc --tar

ARM 平台下的 SSHD 配置

sshd_config 文件中 允许 root 用户登录 PermitRootLogin yes 配置为内部的 sftp Subsystem sftp internal-sftp key 配置 ssh-keygen -t rsa -f ssh_host_rsa_key -N ""ssh-keygen -t dsa -f ssh_host_dsa_key -N ""ssh-keygen -t ecdsa -f ssh_host_ecdsa_key -N "&

Win32平台下的微软C编译器的对齐策略

引言 首先看一个C语言下结构体的小程序. #include<stdio.h> struct StudentInfo { char i; int j; }; void main() { printf("%d\n",sizeof(struct StudentInfo)); } 输出结果:8 不解,以为是5.其实这涉及到计算机内存对齐的问题,在计算机组成原理中有介绍. 概述 许多实际的计算机系统对基本类型数据在内存中存放的位置有限制,它们会要求这些数据的首地址的值是某个数k(通常

内存对齐详解

内存对齐,memory alignment.为了提高程序的性能,数据结构(尤其是栈)应该尽可能地在自然边界上对齐.原因在于,为了访问未对齐的内存,处理器需要作两次内存访问:然而,对齐的内存访问仅需要一次访问.内存对齐一般讲就是cpu access memory的效率(提高运行速度)和准确性(在一些条件下,如果没有对齐会导致数据不同步现象).依赖cpu,平台和编译器的不同.一些cpu要求较高(这句话说的不准确,但是确实依赖cpu的不同),而有些平台已经优化内存对齐问题,不同编译器的对齐模数不同.总

结构体的对齐访问

什么是结构体对齐访问(1)结构体中元素的访问其实本质上还是用指针方式,结合这个元素在整个结构体中的偏移量和这个元素的类型来进行访问的.(2)但是实际上结构体的元素的偏移量比较复杂,因为结构体要考虑元素的对齐访问,所以每个元素时间占的字节数和自己本身的类型所占的字节数不一定完全一样.(譬如char c实际占字节数可能是1,也可以是2,也可能是3,也可以能4····)(3)一般来说,我们用.的方式来访问结构体元素时,我们是不用考虑结构体的元素对齐的.因为编译器会帮我们处理这个细节.但是因为C语言本身

C语言之结构体以及结构体对齐访问

1:简单理解,结构体就是数组的进一步发展,数据的优点和缺陷在于数据里面是元素类型必须相同,但是结构体没有这个要求,结构体里面元素的类型可以相同也可以不同. 2:结构体的定义: struct student {     int age;     char name[20]; }s1; 上面这种方法是结构体定义的同时定义变量,结构体的定义有两部分组成 struct studen:结构体的类型 s1:类型为struct student的结构体变量,当然还可以用struct studet s2:l来定义

C语言之gcc中支持的内存对齐指令

1:gcc中支持但不推荐使用的指令 #pragma pack() :取消内存对齐访问 #pragma pack(n) (n=1/2/4/8):按n字节对齐 #pragma pack(2)  struct mystruct1 { int a; char b; short c; } struct mystruct2 { int a;; double b; short c; }  #pragma pack() 以上这部分内容就是按2字节对齐了. 分析: (1)#pragma是用来指挥编译器,或者说设置

【转】C/C++ struct/class/union内存对齐

原文链接:http://www.cnblogs.com/Miranda-lym/p/5197805.html struct/class/union内存对齐原则有四个: 1).数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员存储的起始位置要从该成员大小或者成员的子成员大小(只要该成员有子成员,比如说是数组,结构体等)的整数倍开始(比如int在32位机为4字节, 则要从4的整数倍地址开始存储),基本类型不包括stru