主机字节序 和 网络字节序

不同的CPU有不同的字节序类型,这些字节序是指 整数 在内存中保存的顺序,这个叫做 主机序。

最常见的有两种:

1.Little endian:将低序字节存储在起始地址

2.Big endian:将高序字节存储在起始地址

LE little-endian(小端)

  • 最符合人的思维的字节序;
  • 地址低位存储值的低位;
  • 地址高位存储值的高位;
  • 怎么讲是最符合人的思维的字节序,是因为从人的第一观感来说;
  • 低位值小,就应该放在内存地址小的地方,也即内存地址低位;
  • 反之,高位值就应该放在内存地址大的地方,也即内存地址高位;

BE big-endian(大端)

  • 最直观的字节序;
  • 地址低位存储值的高位;
  • 地址高位存储值的低位;
  • 为什么说直观,不要考虑对应关系;
  • 只需要把内存地址从左到右按照由低到高的顺序写出;
  • 把值按照通常的高位到低位的顺序写出;
  • 两者对照,一个字节一个字节的填充进去;

例子:在内存中双字 0x01020304(DWORD) 的存储方式 

内存地址

4000 4001 4002 4003 
LE 04 03 02 01 
BE 01 02 03 04

例子:如果我们将0x1234abcd写入到以0x0000开始的内存中,则结果为

big-endian  little-endian
0x0000  0x12      0xcd
0x0001  0x23      0xab
0x0002  0xab      0x34
0x0003  0xcd      0x12

x86系列CPU都是little-endian的字节序。

网络字节顺序是TCP/IP中规定好的一种数据表示格式,它与具体的CPU类型、操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释。网络字节顺序采用big endian排序方式。

为了进行转换 bsd socket提供了转换的函数 有下面四个

htons 把unsigned short类型从主机序转换到网络序
htonl 把unsigned long类型从主机序转换到网络序
ntohs 把unsigned short类型从网络序转换到主机序
ntohl 把unsigned long类型从网络序转换到主机序

在使用little endian的系统中,这些函数会把字节序进行转换;

在使用big endian类型的系统中,这些函数会定义成空宏;

同样,在网络程序开发时 或是跨平台开发时,也应该注意保证只用一种字节序,不然两方的解释不一样就会产生bug。

注:

1、网络与主机字节转换函数:htons()、ntohs()、htonl()、ntohl()  (注意:s 就是short l是long h是host n是network)

2、不同的CPU上运行不同的操作系统,字节序也是不同的,参见下表。

处理器    操作系统    字节排序
Alpha    全部    Little endian
HP-PA    NT    Little endian
HP-PA    UNIX    Big endian
Intelx86    全部    Little endian <-----x86系统是小端字节序系统
Motorola680x()    全部    Big endian
MIPS    NT    Little endian
MIPS    UNIX    Big endian
PowerPC    NT    Little endian
PowerPC    非NT    Big endian  <-----PPC系统是大端字节序系统
RS/6000    UNIX    Big endian
SPARC    UNIX    Big endian
IXP1200 ARM核心    全部    Little endian

参考:

http://baike.baidu.com/view/2194385.htm


IP地址的三种表示格式及在开发中的应用

使用TCP/IP协议进行网络应用开发的朋友首先要面对的就是对IP地址信息的处理。IP地址其实有三种不同的表示格式。IP地址是IP网络中数据传输的依据,它标识了IP网络中的一个连接,一台主机可以有多个IP地址,IP分组中的IP地址在网络传输中将保持不变。下面具体介绍IP地址的三种不同表示格式。

一、点分10进制表示格式

这是我们最常见的表示格式,比如某机的IP地址可能为“202.101.105.66”。事实上,对于Ipv4(IP版本)来说,IP地址是由一个32位的二进制数所构成,但这样一串数字序列无疑是十分冗长并且难以阅读和记忆的。为了方便人们的记忆和使用,就将这串数字序列分成4组,每组8位,并改为用10进制数进行表示,最后用小原点隔开,于是就演变成了“点分10进制表示格式”。

来看看刚才那个IP地址的具体转化过程:

IP地址:11001010011001010110100101000010

分成4组后:11001010 01100101 01101001 01000010

十进制表示:202 101 105 66

点分表示:202.101.105.66

二、网络字节顺序格式(NBO,Network Byte Order)

下面我们来谈谈网络字节顺序格式,它和我们后面将要介绍的主机字节顺序格式一样,都只在进行网络开发中才会遇到。因此,在下面的介绍中,我假设读者对Socket编程知识有一定的基础。

在网络传输中,TCP/IP协议在保存IP地址这个32位二进制数时,协议规定采用在低位存储地址中包含数据的高位字节的存储顺序,这种顺序格式就被称为网络字节顺序格式。在实际网络传输时,数据按照每32位二进制数为一组进行传输,由于存储顺序的影响,实际的字节传输顺序是由高位字节到低位字节的传输顺序。

为了使通信的双方都能够理解数据分组所携带的源地址、目的地址以及分组的长度等二进制信息,无论是主机还是路由器,在发送每一个分组以前,都必须将二进制信息转换为TCP/IP标准的网络字节顺序格式。网络字节顺序格式的地址不受主机、路由器类型的影响,它的表示是唯一的。

在Socket编程开发中,通过函数inet_addr和inet_ntoa可以实现点分字符串与网络字节顺序格式IP地址之间的转换。

inet_addr函数原型如下:

unsigned long inet_addr(const char FAR * cp)

函数中的参数cp指向网络中标准的点分地址字符串,其中每个以点分开的数字不可以大于255,这些数字可以是十进制、八进制、十六进制或者混合使用。

如“10.23.2.3”、“012.003.002.024”、“0xa.0x3.0x14.0x2”、“10.003.2.0x12”。

下面举一个函数小例子,该函数可以用来测试一目标主机的某端口是否开放,这是端口扫描技术的基础。

bool ScanPort(char * m_IP,u_short m_port) {
	struct sockaddr_in m_SqlAddress; //server‘s address.
	SOCKET m_socket;
	int ret;
	memset((char *)&m_SqlAddress,0,sizeof(m_SqlAddress));
	m_SqlAddress.sin_port = htons(m_port); 
	m_SqlAddress.sin_addr.s_addr = inet_addr(m_IP); 
	m_SqlAddress.sin_family = AF_INET;

	m_socket = socket(PF_INET,SOCK_STREAM,IPPROTO_TCP); // Create TCP Connect.
	if (m_socket < 0) {
		return FALSE;
	}
	ret = connect(m_socket,(struct sockaddr *)&m_SqlAddress,sizeof(m_SqlAddress));

	return(ret);
}

三、主机字节顺序格式(HBO,Host Byte Order)

主机字节顺序格式顾名思义,其IP地址的格式是和具体主机或者路由器相关的。对于不同的主机,在进行IP地址的存储时有不同的格式,比如对于Motorola 68k系列主机,其HBO与NBO是相同的。而对于Intel x86系列,HBO与NBO则正好相反。

在Socket编程中,有四个函数来完成主机字节顺序格式和网络字节顺序格式之间的转换,它们是:htonl、htons、ntohl、和ntohs。htons和ntohs完成16位无符号数的相互转换,htonl和ntohl完成32位无符号数的相互转换。

在实际应用中我们常见到将端口号转换的例子(如上例)。这是因为,如果用户输入一个数字,而且将指定使用这一数字作为端口号,应用程序则必须在使用它建立地址以前,把它从主机字节顺序转换成网络字节顺序(使用htons()函数),以遵守TCP/IP协议规定的存储标准。相应地,如果应用程序希望显示包含于某一地址中的端口号(例如从getpeername()函数中返回的),这一端口号就必须在被显示前从网络顺序转换到主机顺序(使用ntohs()函数)。

那么,对于IP地址,主机字节顺序格式的转换又有哪些应用呢?

应用一:如果想知道从202.156.2.23到202.156.9.65这两个IP之间到底有多少个主机地址怎么办?这时就可以将两个IP地址转换为主机字节顺序的格式然后相减来得到,具体的实现如下:

int GetIPCount(char * ip1,char * ip2) {
	long pp;;
	long ss;;

	pp = ntohl(inet_addr(ip1));;
	ss = ntohl(inet_addr(ip2));;

	return(ss - pp + 1);;
}

应用二:如果对一个网段进行扫描,比如,当前正在扫描202.156.23.255,怎么让程序知道下一个应扫的IP是202.156.24.0?这时可以将当前IP转换成主机字节顺序格式并加1后,在转换回网络格式即可,具体实现如下:

char *GetNextIp(char *m_curip) {
	struct sockaddr_in in;;
	long pp;;
	char *re;;

	pp = ntohl(inet_addr(m_curip));;
	pp = pp + 1;;

	in.sin_addr.s_addr = htonl(pp);;
	re = inet_ntoa(in.sin_addr);;

	return (re);;
}

总结

本文介绍了IP地址的三种不同表示格式,包括各种格式产生的原因、具体含义以及在Socket编程开发中的一些应用。在实际应用中,必须遵循应用时所应采用的格式标准,同时还应灵活运用格式间的相互转换以及计算技巧。通过对本文的阅读,希望可以给读者在以后的学习和工作开发带来启发。

参考:

http://bbs.csdn.net/topics/60375114

时间: 2024-10-19 13:28:17

主机字节序 和 网络字节序的相关文章

第五篇:主机字节序与网络字节序的转换

前言 我们知道,数据在主机内的存放有两种模式,也就是说,主机字节序有两种:大端和小端( 这里假定读者已经清楚这个问题 ).但在网络通信中,要求通信数据( 通信数据这里指IP号和端口号 )的使用必须用网络字节序.什么又是网络字节序? 网络字节序可以理解为主机字节序的大端模式.如果你的主机字节序原本就是大端模式,那么你可以考虑不用将通信数据转换为网络字节序:但如果你的主机字节序是小端,那么通信数据必须被下面提及到的其中某个函数进行处理,转换成网络字节序后方可使用( 即存放进套接字地址结构变量 ).

Python网络编程——主机字节序和网络字节序之间的相互转换

If you ever need to write a low-level network application, it may be necessary to handle the low-level data transmission over the wire between two machines. This operation requires some sort of conversion of data from the native host operating system

linux程序设计——主机字节序和网络字节序(第十五章)

15.2.10    主机字节序和网络字节序 当在基于intel处理器的linux机器上运行新版本的服务器和客户程序时,可以用netstat命令查看网络连接状况.它显示了客户/服务器连接正在等待关闭.连接将在一段超时间之后关闭,如下所示: 可以看到这条连接对应的服务器和客户的端口号.local address一栏显示的是服务器,而foreign address一栏显示的是远程客户(即使是在同一台机器上,它仍然是通过网络连接的).为了确保所有套接字都是不同的,这些客户端口一般都与服务器监听套接字不

主机字节序和网络字节序转换

为什么要转换? 主机字节序:整数在内存中保存的顺序,不同的处理器对应不容的模式 Little endian 将低序字节存储在起始地址 Big endian    将高序字节存储在起始地址 网络字节序:整数在网络中的发送顺序 网络字节顺序是TCP/IP中规定好的一种数据表示格式,它与具体的CPU类型.操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释. 网络字节顺序采用big endian排序方式 htons 本地的无符号short型主机字节序转换为网络字节序 htonl    

TCP/IP网络编程之字节序和网络字节序

一.概要 本篇文章主要讲解基于.net中tcp/ip网络通信编程中的网络字节序.在自我进步的过程中记录这些内容,方便自己记忆的同时也希望可以帮助到大家.技术的进步源自于分享和不断的自我突破. 技术交流QQ群:580749909  欢迎交流有问必答,文章尾有个人的微信公众号有兴趣的小伙伴多多关注. 二.简介 在此之前我们需要了解清楚几个概念. CPU架构:人们常说的x86 x64是一种架构,但是他有32位的和64位的.32位的叫x86 ,后来出现基于它的64位版,就叫x64. 操作系统位数 :64

主机字节序 与 网络字节序

一.字节顺序 是指占用内存多于一个字节类型的数据在内存中的存放顺序. java中一个int型数据占用4个字节,假如有一个16进制的int数,int value = 0x01020304 小端字节序(little endian):低字节数据存放在内存低地址 大端字节序(bigendian): 低字节数据存放在高地址处 主机字节序跟CPU有关的,IA架构(Intel.AMD)的CPU中是Little-Endian,而PowerPC .SPARC和Motorola处理器是Big-Endian. 网络字

大端与小端,大尾与小尾,高尾端与低尾端,主机字节序与网络字节序

概念剖析 一时记忆与理解大端.小端的概念很容易,但时间一长,对于相似的概念人类的记忆向来是模糊的,甚至是换位的.所以除非你的记忆非常牢靠,否则借助大端和小端这样的名字,你很难将概念与内容联系紧密. 也有文章提到用大尾与小尾的概念,个人觉得这个概念还是没有解决存储概念中的基本问题,大与小还是没有脱离以前的概念,但是引入了尾的概念,已经比大端与小端要更清晰一点. 目前对于记忆大小端,我觉得这篇文章中提到的高尾端/低尾端名词记忆方法比较科学.形象.实话说,当时计算机科学著作翻译Big Endian与S

python通过ntohl和htonl等函数实现主机字节序和网络字节序相互转换

Python的socket库提供了将数据在网络字节序和主机字节序之间相互转换的函数.有什么作用呢? 在编写低层网络应用时,或许需要处理通过电缆在两台设备之间传送的低层数据.在这种操作中,需要把主机操作系统发出的数据转换成网络格式,或者做逆向转换,因为这两种数据的表示方式不一样. 技术点解析: 1.定义convert_integer()函数,注意函数格式(以后都会提醒这个,要养成习惯) 2.socket库中的类函数 ntohl() 把网络字节序转换成了长整形主机字节序 htonl() 把长整形主机

主机字节序与网络字节序的转换:ntohl()与htonl()

#!/usr/bin/env python #coding=utf-8 import socket def convert_integer(): data=1234 #32-bit print "Original: %s => Long host byte order: %s, Network byte order: %s" %(data,socket.ntohl(data),socket.htonl(data)) #16-bit print "Original: %s