字节与字符 一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节,一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制最小值为0,最大值为255。
UTF-8码:一个英文字符为一个字节,一个中文汉字(含繁体字)为三个字节。 Unicode码:一个英文字符为两个字节,一个中文汉字(含繁体字)等于两个字节。 符号:英文标点占一个字节,中文标点占两个字节。 不同数量级间: 数据存储是以10进制表示,数据传输是以2进制表示。 1KB=1024B;1MB=1024KB;其中1024=2^10; 1B=8bit;
存储类型:
各种数据类型所占字节 数据类型 存储空间大小
byte(字节型) 1 2^8
Boolean(布尔型) 2
Integer(整型) 2 2^32
Long(长整型) 4 2^64
short() 2 2^16
Double(双精度浮点型)8
相关单位:
B与bit 数据存储是以字节(Byte)为单位,数据传输大多是以位为单位,一个位代表0或者1,每8个位组成一个字节(Byte,简写B),是最小一级的信息单位。 1KB=1024byte; 数据类型: Byte数据类型(字节型)用一个字节(Byte)存储,可区分256个数字,范围0~255,Byte是从0~255的无符号类型,不能表示负数。 Byte和Char Byte是字节数据类型,Char是字符数据类型,Java用char来表示一个字符。 在参与算术运算是char类型会自动转为整型;如字符A会转为对应ASCII码65。 char是用来表示一个字符,而不是一个字,因为一个字要占用两个字节。而存储一个ANSI字符只需一个字节。注意,强调是ANSI字符,而不是Unicode字符。因为Unicode要占用两个字节。
byte类型是最自由的一种。它就占用一个字节,但没有定义这个字节拿来干什么。char定义为一个Unsigned Byte类型。也就是无符号的一个字节。它将一个字节的8位全占用了。可以表示的数据范围是0到255之间。 如果你确定处理的字符串是标准的ANSI字符串,那不必转换也可以直接一个字节一个字节地处理。如果要处理的字符串不定或是统一的Unicode字符串则要进行转换后进行处理。