位、字节、字符、汉字的关系

1 bit 二进制数据1 byte = 8 bit

1 字母 = 1 byte = 8 bit

1 汉字 = 2 byte = 16 bit

1. bit:位

一个二进制数据0或1,是1bit;

2. byte:字节

1 byte = 8 bit

3.
一个英文字符占一个字节;

1 字母 = 1 byte = 8 bit

4. 一个汉字占2个字节;

1 汉字 = 2 byte = 16 bit

(这个其实不一定正确,要看编码类型)

5.
标点符号

A>. 汉字输入状态下,默认为全角输入方式;

B>. 英文输入状态下,默认为半角输入方式;

C>. 全角输入方式下,标点符号占2字节;

D>. 半角输入方式下,标点符号占1字节;

故:汉字输入状态下的字符,占2个字节 (但不排除,自己更改了默认设置);

英文输入状态下的字符,占1个字节 (但不排除,自己更改了默认设置);

时间: 2024-10-05 04:26:01

位、字节、字符、汉字的关系的相关文章

Java bit、byte、位、字节、汉字、字符

package com.suypower.chengyu.test; public class ByteTest { /** * byte 8 bits -128 - + 127 * 1 bit = 1 二进制数据 * 1 byte = 8 bit * 1 字母 = 1 byte = 8 bit(位) * 1 汉字 = 2 byte = 16 bit */ public static void main(String[] args) { // TODO Auto-generated method

IO-04字节-字符转换流

掌握OutputStreamWriter和InputStreamReader的作用. 在整个IO包中,实际上就是分为字节流和字符流,但除了这两个流之外,还存在一组字节-字符流转换类. OutputStreamWriter:是Writer的子类,将输出的字符流编程字节流,既:将一个字符流的输出对象变成字节流输出对象. InputStreamReader:是Reader的子类,将输入的字节流变成字符流.既:将一个字节流的输入对象变成字符流的输入对象. 字符流转换成字节流的代码: package li

数据库插入四字节字符报错Incorrect string value: ‘\xF0\xA3\x8E\

数据库插入四字节字符报错Incorrect string value: '\xF0\xA3\x8E\xB4\xE9\xAB.. 改变字符编码utf8mb4貌似很二 直接找到四字节那个字符改成正常的字符貌似有点简单粗暴(俺就是这么干的!O(∩_∩)O哈哈~). 大家怎么看?

Android——检测TXT文件中是否含有双字节字符

在读取双字节字符时,主要涉及到编码的选取: Java代码   public static boolean isRightfulTXT(File f) { // TODO Auto-generated method stub String regexp="[^\\x00-\\xff]";//双字节字符 Pattern p=Pattern.compile(regexp); try { FileInputStream fis=new FileInputStream(f); //"G

Qt 4.5发布(最大的变动是换用LGPL许可证,移植进了苹果的Cocoa框架。之前的Qt只支持Carbon框架,现在的Qt 4.5两者都支持。单一源代码创建出支持32位或64位字节的Intel或PowerPC Mac二进制文件)

Nokia的开源Qt开发工具正式发布了4.5版.如前所述,Qt 4.5最大的变动是换用LGPL许可证,目前采用的三个许可证分别为LGPL/GPL和商业许可证. 新版增强图形系统.数据处理和网络引擎性能,其它主要特性有:提升与WebKit渲染引擎的集成度,包括Netscape浏览器插件API支持,Qt应用程序可以载入Flash:更先进的Web 用户界面效果,包括动画.转换和缩放:新的JavaScript引擎可提供更强的性能. Qt4.5还被移植进了苹果的Cocoa框架.之前的Qt只支持Carbon

Java数字和字符的对照关系表

/* 数字和字符的对照关系表(编码表): ASCII码表:American Standard Code for Information Interchange,美国信息交换标准代码. Unicode码表:万国码.也是数字和符号的对照关系,开头0-127部分和ASCII完全一样,但是从128开始包含有更多字符. 48 - '0' 65 - 'A' 97 - 'a' */ public class Demo03DataTypeChar { public static void main(String

每日一学--bit、byte、位、字节、汉字、字符

转载自:http://www.cnblogs.com/strivers/archive/2011/01/04/1925826.html package com.suypower.chengyu.test; public class ByteTest { /** * byte 8 bits -128 - + 127 * 1 bit = 1 二进制数据 * 1 byte = 8 bit * 1 字母 = 1 byte = 8 bit(位) * 1 汉字 = 2 byte = 16 bit */ pu

字/位/字节/字长

1.位(bit) 来自英文bit,音译为“比特”,表示二进制位.位是计算机内部数据储存的最小单位,11010100是一个8位二进制数.一个二进制位只可以表示0和1两种状态(21):两个二进制位可以表示00.01.10.11四种(22)状态:三位二进制数可表示八种状态(23)…….   2.字节(byte)    字节来自英文Byte,音译为“拜特”,习惯上用大写的“B”表示.  字节是计算机中数据处理的基本单位.计算机中以字节为单位存储和解释信息,规定一个字节由八个二进制位构成,即1个字节等于8

位/字节/ASCII/UTF-8/GBK/GB2312/Unicode 扫盲

1个字节(Byte)=8位 bit  1位就是计算机中的 1 或0 比如10进制1 ,ASCII码是49,二机制是: 00110001 它占用一个字节. ASCII码:一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间.一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制.最小值0,最大值255.如一个ASCII码就是一个字节. UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节. Unicode编码:Unicode是一种编