不同的CPU有不同的字节序类型,这些字节序是指 整数 在内存中保存的顺序,这个叫做 主机序。
最常见的有两种:
1.Little endian:将低序字节存储在起始地址
2.Big endian:将高序字节存储在起始地址
LE little-endian(小端)
- 最符合人的思维的字节序;
- 地址低位存储值的低位;
- 地址高位存储值的高位;
- 怎么讲是最符合人的思维的字节序,是因为从人的第一观感来说;
- 低位值小,就应该放在内存地址小的地方,也即内存地址低位;
- 反之,高位值就应该放在内存地址大的地方,也即内存地址高位;
BE big-endian(大端)
- 最直观的字节序;
- 地址低位存储值的高位;
- 地址高位存储值的低位;
- 为什么说直观,不要考虑对应关系;
- 只需要把内存地址从左到右按照由低到高的顺序写出;
- 把值按照通常的高位到低位的顺序写出;
- 两者对照,一个字节一个字节的填充进去;
例子:在内存中双字 0x01020304(DWORD) 的存储方式
内存地址
4000 4001 4002 4003
LE 04 03 02 01
BE 01 02 03 04
例子:如果我们将0x1234abcd写入到以0x0000开始的内存中,则结果为
big-endian little-endian
0x0000 0x12 0xcd
0x0001 0x23 0xab
0x0002 0xab 0x34
0x0003 0xcd 0x12
x86系列CPU都是little-endian的字节序。
网络字节顺序是TCP/IP中规定好的一种数据表示格式,它与具体的CPU类型、操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释。网络字节顺序采用big endian排序方式。
为了进行转换 bsd socket提供了转换的函数 有下面四个
htons 把unsigned short类型从主机序转换到网络序
htonl 把unsigned long类型从主机序转换到网络序
ntohs 把unsigned short类型从网络序转换到主机序
ntohl 把unsigned long类型从网络序转换到主机序
在使用little endian的系统中,这些函数会把字节序进行转换;
在使用big endian类型的系统中,这些函数会定义成空宏;
同样,在网络程序开发时 或是跨平台开发时,也应该注意保证只用一种字节序,不然两方的解释不一样就会产生bug。
注:
1、网络与主机字节转换函数:htons()、ntohs()、htonl()、ntohl() (注意:s 就是short l是long h是host n是network)
2、不同的CPU上运行不同的操作系统,字节序也是不同的,参见下表。
处理器 操作系统 字节排序
Alpha 全部 Little endian
HP-PA NT Little endian
HP-PA UNIX Big endian
Intelx86 全部 Little endian <-----x86系统是小端字节序系统
Motorola680x() 全部 Big endian
MIPS NT Little endian
MIPS UNIX Big endian
PowerPC NT Little endian
PowerPC 非NT Big endian <-----PPC系统是大端字节序系统
RS/6000 UNIX Big endian
SPARC UNIX Big endian
IXP1200 ARM核心 全部 Little endian
参考:
http://baike.baidu.com/view/2194385.htm
IP地址的三种表示格式及在开发中的应用
使用TCP/IP协议进行网络应用开发的朋友首先要面对的就是对IP地址信息的处理。IP地址其实有三种不同的表示格式。IP地址是IP网络中数据传输的依据,它标识了IP网络中的一个连接,一台主机可以有多个IP地址,IP分组中的IP地址在网络传输中将保持不变。下面具体介绍IP地址的三种不同表示格式。
一、点分10进制表示格式
这是我们最常见的表示格式,比如某机的IP地址可能为“202.101.105.66”。事实上,对于Ipv4(IP版本)来说,IP地址是由一个32位的二进制数所构成,但这样一串数字序列无疑是十分冗长并且难以阅读和记忆的。为了方便人们的记忆和使用,就将这串数字序列分成4组,每组8位,并改为用10进制数进行表示,最后用小原点隔开,于是就演变成了“点分10进制表示格式”。
来看看刚才那个IP地址的具体转化过程:
IP地址:11001010011001010110100101000010
分成4组后:11001010 01100101 01101001 01000010
十进制表示:202 101 105 66
点分表示:202.101.105.66
二、网络字节顺序格式(NBO,Network Byte Order)
下面我们来谈谈网络字节顺序格式,它和我们后面将要介绍的主机字节顺序格式一样,都只在进行网络开发中才会遇到。因此,在下面的介绍中,我假设读者对Socket编程知识有一定的基础。
在网络传输中,TCP/IP协议在保存IP地址这个32位二进制数时,协议规定采用在低位存储地址中包含数据的高位字节的存储顺序,这种顺序格式就被称为网络字节顺序格式。在实际网络传输时,数据按照每32位二进制数为一组进行传输,由于存储顺序的影响,实际的字节传输顺序是由高位字节到低位字节的传输顺序。
为了使通信的双方都能够理解数据分组所携带的源地址、目的地址以及分组的长度等二进制信息,无论是主机还是路由器,在发送每一个分组以前,都必须将二进制信息转换为TCP/IP标准的网络字节顺序格式。网络字节顺序格式的地址不受主机、路由器类型的影响,它的表示是唯一的。
在Socket编程开发中,通过函数inet_addr和inet_ntoa可以实现点分字符串与网络字节顺序格式IP地址之间的转换。
inet_addr函数原型如下:
unsigned long inet_addr(const char FAR * cp)
函数中的参数cp指向网络中标准的点分地址字符串,其中每个以点分开的数字不可以大于255,这些数字可以是十进制、八进制、十六进制或者混合使用。
如“10.23.2.3”、“012.003.002.024”、“0xa.0x3.0x14.0x2”、“10.003.2.0x12”。
下面举一个函数小例子,该函数可以用来测试一目标主机的某端口是否开放,这是端口扫描技术的基础。
bool ScanPort(char * m_IP,u_short m_port) { struct sockaddr_in m_SqlAddress; //server‘s address. SOCKET m_socket; int ret; memset((char *)&m_SqlAddress,0,sizeof(m_SqlAddress)); m_SqlAddress.sin_port = htons(m_port); m_SqlAddress.sin_addr.s_addr = inet_addr(m_IP); m_SqlAddress.sin_family = AF_INET; m_socket = socket(PF_INET,SOCK_STREAM,IPPROTO_TCP); // Create TCP Connect. if (m_socket < 0) { return FALSE; } ret = connect(m_socket,(struct sockaddr *)&m_SqlAddress,sizeof(m_SqlAddress)); return(ret); }
三、主机字节顺序格式(HBO,Host Byte Order)
主机字节顺序格式顾名思义,其IP地址的格式是和具体主机或者路由器相关的。对于不同的主机,在进行IP地址的存储时有不同的格式,比如对于Motorola 68k系列主机,其HBO与NBO是相同的。而对于Intel x86系列,HBO与NBO则正好相反。
在Socket编程中,有四个函数来完成主机字节顺序格式和网络字节顺序格式之间的转换,它们是:htonl、htons、ntohl、和ntohs。htons和ntohs完成16位无符号数的相互转换,htonl和ntohl完成32位无符号数的相互转换。
在实际应用中我们常见到将端口号转换的例子(如上例)。这是因为,如果用户输入一个数字,而且将指定使用这一数字作为端口号,应用程序则必须在使用它建立地址以前,把它从主机字节顺序转换成网络字节顺序(使用htons()函数),以遵守TCP/IP协议规定的存储标准。相应地,如果应用程序希望显示包含于某一地址中的端口号(例如从getpeername()函数中返回的),这一端口号就必须在被显示前从网络顺序转换到主机顺序(使用ntohs()函数)。
那么,对于IP地址,主机字节顺序格式的转换又有哪些应用呢?
应用一:如果想知道从202.156.2.23到202.156.9.65这两个IP之间到底有多少个主机地址怎么办?这时就可以将两个IP地址转换为主机字节顺序的格式然后相减来得到,具体的实现如下:
int GetIPCount(char * ip1,char * ip2) { long pp;; long ss;; pp = ntohl(inet_addr(ip1));; ss = ntohl(inet_addr(ip2));; return(ss - pp + 1);; }
应用二:如果对一个网段进行扫描,比如,当前正在扫描202.156.23.255,怎么让程序知道下一个应扫的IP是202.156.24.0?这时可以将当前IP转换成主机字节顺序格式并加1后,在转换回网络格式即可,具体实现如下:
char *GetNextIp(char *m_curip) { struct sockaddr_in in;; long pp;; char *re;; pp = ntohl(inet_addr(m_curip));; pp = pp + 1;; in.sin_addr.s_addr = htonl(pp);; re = inet_ntoa(in.sin_addr);; return (re);; }
总结
本文介绍了IP地址的三种不同表示格式,包括各种格式产生的原因、具体含义以及在Socket编程开发中的一些应用。在实际应用中,必须遵循应用时所应采用的格式标准,同时还应灵活运用格式间的相互转换以及计算技巧。通过对本文的阅读,希望可以给读者在以后的学习和工作开发带来启发。
参考:
http://bbs.csdn.net/topics/60375114