汉字的大小

UTF-8:汉字3个字节,24位

GBK:汉字2个字节,16位(java默认的编码)

    String aa="程序员";
        System.out.println(aa);
        System.out.println("字符长度:"+aa.length());
        System.out.println("字节长度:"+aa.getBytes().length);

UTF-8: 程序员
    字符长度:3
    字节长度:9

GBK:    程序员
    字符长度:3
    字节长度:6

时间: 2024-10-12 12:44:48

汉字的大小的相关文章

Linux根文件系统

Linux根文件系统详解 Linux系统的文件系统又被称为根文件系统(roofs),FHS是Linux系统的文件系统标准,各个不同的Linux发行版都得遵从FHS FHS规定如下: ·/bin目录 bin(binary,二进制文件),该目录里面是一些二进制文件,Linux系统下二进制文件是ELF格式的,而Windows系统下的二进制文件是PE格式的,该目录下全是一些可执行的二进制文件,所有的用户命令都在其中 ·/boot目录 该目录下包含着一些和系统启动相关的文件,比如我们的内核文件.initr

web前端基础知识

#HTML 什么是HTML,和他ML... 网页可以比作一个装修好了的,可以娶媳妇的房子. 房子分为:毛坯房,精装修 毛坯房的修建: 砖,瓦,水泥,石头,石子.... 精装修的房子:在毛坯房的基础上进行粉刷,覆盖,雕琢,修饰等操作.... HTML标签 相当于盖毛坯房用的石子,砖瓦....:房子成功,但是不会很好看. CSS属性  相当于装修时候使用的刷子,涂料,扣板...: 可以让毛坯房变得更加美观 HTML 超文本标记语言. HyperText Markup Language HTML标签的

字体,字号与尺寸对应表

了解字体的一样常识,不管做一份文档编辑还是网页开发,都是很有必要的.整齐划一,井然有序才终是大家之道. 1.字体 在文档编辑中,我们常用的是宋体,小四号字,新罗马字体,字母和数字用的是Arial字体,段落首行缩进2个字体,采用多倍行距中的1.25倍行距. 在网页开发中,普遍偏爱微软雅黑与宋体,14/16px,非衬线体. 2.字号 印刷文字有大.小的不同变化,排版及图象处理软件中汉字字体大小的计量,前主要采用印刷业专用的号数制和点数制.其尺寸规格以正方形的汉字为准(对于长或扁的变形字,则要用字的双

LCD学习

LCD简介(1)显示器,常见显示器(2)LCD(Liquid Crystal Display),液晶显示器,原理介绍(3)LCD应用领域(4)LED OLED1.17.1.2.电子显示器的原理(1)像素(分辨率)(2)显存,用来做显示的内存(3)字模(4)字库(5)控制器和驱动器(6)软件+硬件实现功能 1.17.1.3 1602显示屏 简介:为什么叫1602(16*2显示器显示2排,每排16个字符).能显示的字符数为 32.此时32不是像素,像素可能是 5*7,我们编程时只需要把相应的字符的的

2.1/2.2字符的编码方式及显示

1.字符集 ASCII码 一字节:包括英文数字这些符号 GB2312编码 汉字为两字节:与ASCII码兼容,后来扩展汉字又有了GBK编码 Unicode编码 包括中,日,韩,英文等格式:有Utf-32,Utf-16,Utf-8三种格式 Utf-32:每个字符都采用4字节(32bit),缺点浪费空间 Utf-16(错一个字符则整个乱码):每个字符的长度为2字节(16bit),常用 Utf-8(容错能力强):每个字符的长度为1~4字节,越常用的字符越短 一般一个文件的开头都会有标志,通过16进制编辑

web前端入门到实战:网页开发中字体,字号与尺寸对应表

[文章来源微信公众号:每天学编程]---关注,后台领取编程资源 了解字体的一样常识,不管做一份文档编辑还是网页开发,都是很有必要的.整齐划一,井然有序才终是大家之道. 1.字体 在文档编辑中,我们常用的是宋体,小四号字,新罗马字体,字母和数字用的是Arial字体,段落首行缩进2个字体,采用多倍行距中的1.25倍行距. 在网页开发中,普遍偏爱微软雅黑与宋体,14/16px,非衬线体. 2.字号 印刷文字有大.小的不同变化,排版及图象处理软件中汉字字体大小的计量,前主要采用印刷业专用的号数制和点数制

宋体汉字字号和点阵大小对应关系

宋体 小五号 -- 9 号 12*12 宋体 五号 -- 11 号 14*14 宋体 小四号 -- 12 号 16*16 宋体 小二号 -- 18 号 24*24 根据Zimo3 字模III 软件测试得出.

中文在C/C++中的处理和汉字乱码问题(wchar_t)

中文字在C/C++中的处理 现在编程的语言和编程环境随着中国的发展開始对中文有进一步的支持.可是对中文的支持整体来说是有缺陷的,并且有与编译环境的不同导致中文在当前的C/C++中有非常多问题,并且非常多版本号对中文的支持是不全然的.就拿DEV-C++和VS2005为例.对与MSDN的帮助和网上的讲述两者在那些代码的支持有非常多不同的地方. 而我要讨论的就是对于中文在C/C++的应用方法. 首先中文字是在一般char的范围以外的,所以我们不能用单个char存储我们的中文字,于是我们大多引进wcha

C#汉字转拼音(支持多音字)

阅读目录 首先在nuget引用对应的包 简单的demo 汉字转拼音类封装 源码分享 之前由于项目需要,中间需要一个汉字转拼音和首拼的功能来做查询,感觉这种功能基本已经成熟化了,于是查找了相关的代码,首先引入眼帘的是下面两篇文章 1.C# 汉字转拼音(支持GB2312字符集中所有汉字) 2.[干货]JS版汉字与拼音互转终极方案,附简单的JS拼音输入法 感谢两位博主,写的比较全也很详细,都有提供源码,大家可以参考下. 由于考虑到接口的需要,于是参考了 第一篇,文章中作者的源码基本能满足汉字转拼音的需