中文汉字和常见英文数字等的unicode编码范围

 
字符集 字数 Unicode编码(\u)
基本汉字 20902字  4E00-9FA5 
基本汉字补充  38字  9FA6-9FCB
扩展A 6582字  3400-4DB5 
扩展B  42711字  20000-2A6D6
扩展C  4149字 2A700-2B734 
扩展D  222字  2B740-2B81D
康熙部首  214字  2F00-2FD5
部首扩展  115字 2E80-2EF3 
兼容汉字  477字  F900-FAD9
兼容扩展  542字 2F800-2FA1D 
PUA(GBK)部件  81字  E815-E86F
部件扩展 452字   E400-E5E8
PUA增补  207字  E600-E6CF
汉字笔画  36字  31C0-31E3
汉字结构  12字  2FF0-2FFB
汉语注音 22字   3105-3120
注音扩展 22字   31A0-31BA
 1字 3007 
数字0-9  10字 30-39 
 小写英文字母  26字 61-7a 
 大写英文字母  26字 41-5a

仅供大家参考使用、、、

时间: 2024-10-07 10:33:38

中文汉字和常见英文数字等的unicode编码范围的相关文章

英文字母对应的Unicode编码

A~Z :65~90 a~z :97~122 0-9 : 48-57 如果想要知道字符串中的值是否是小写英文字符,不使用工具包的一种方法就是使用Unicode编码值,举例: package main import ( "fmt" ) func main() { // str := "helloworld" //返回str is all lower char str := "hello4world" //返回str is not all lower

英文字母和中文汉字在不同字符集编码下的字节数

英文字母和中文汉字在不同字符集编码下的字节数 英文字母: 字节数 : 1;编码:GB2312 字节数 : 1;编码:GBK 字节数 : 1;编码:GB18030 字节数 : 1;编码:ISO-8859-1 字节数 : 1;编码:UTF-8 字节数 : 4;编码:UTF-16 字节数 : 2;编码:UTF-16BE 字节数 : 2;编码:UTF-16LE 中文汉字: 字节数 : 2;编码:GB2312 字节数 : 2;编码:GBK 字节数 : 2;编码:GB18030 字节数 : 1;编码:ISO

linux运维常见英文报错中文翻译(菜鸟必知)

linux常见英文报错中文翻译(菜鸟必知) 1.command not found   命令没有找到 2.No such file or directory   没有这个文件或目录 3.Permission denied   权限不足 4.No space left on device   磁盘没有剩余空间 5.File exists   文件已经存在 6.Is a directory   这是1个目录 7.Not a directory   不是1个目录 8.Warning: Changing

java 正则表达式 验证字符串 只包含汉字英文数字

String content = “testContent”; String regex="^[a-zA-Z0-9\u4E00-\u9FA5]+$"; Pattern pattern = Pattern.compile(regex); Matcher match=pattern.matcher(content); boolean b=match.matches(); if(b) { Toast.makeText(this, "success...", Toast.L

JS判断字符串长度(英文占1个字符,中文汉字占2个字符)

//计算字符串长度(英文占1个字符,中文汉字占2个字符) 方法一: String.prototype.gblen = function() { var len = 0; for (var i=0; i<this.length; i++) { if (this.charCodeAt(i)>127 || this.charCodeAt(i)==94) { len += 2; } else { len ++; } } return len; } 方法二: function strlen(str){

java 常见的几种类型范围说明,char 型变量中能不能存贮一个中文汉字

package com.yuan.test; public class Autogrew { public static void main(String[] args) {  // 保存 short 可取的最大值的常量,最大值为 215-1.(32 767)   // 保存 short 可取的最小值的常量,最小值为 -215.(-32 768)      short s1=11278;      s1+=1;      //s1=s1+1;//报错 自动会转换成int 类型      Syst

常见验证数字的正则表达式

jquery  代码如下 复制代码 intege:"^-?[1-9]//d*$", //整数 intege1:"^[1-9]//d*$", //正整数 intege2:"^-[1-9]//d*$", //负整数 num:"^([+-]?)//d*//.?//d+$", //数字 num1:"^([1-9]//d*|0)$", //正数(正整数 + 0) num2:"^-[1-9]//d*|0$&q

中文汉字转换拼音PHP类

1 <?php 2 /** 3 * 中文汉字转换拼音类 4 * 功能支持 5 * 1.支持中文转换全拼 6 * 2.支持中文转换简拼(首字母) 7 * 3.支持转换的字符串返回格式设置(字符中间的间隔字符) 8 * 方法包含四个可以直接调用 请查看类注释 以及调用示例 9 * getJp.getQp.getJpDelimiter.getQpDelimiter 10 * 11 * 以下是研究本代码看懂本类需要的知识点: 12 * 1.掌握PHP的面向对象编程的基本用法 13 * 2.掌握计算机AS

正则表达式之判断用户注册信息是否为汉字、字母和数字

一般在写用户注册模块的时候都在对注册的用户名进行判断,查看一下有没有[email protected]#$%^&*()等这样的特殊字符,注册信息里一般将这些字符视为非法字符不允许注册.怎么进行判断呢,这里就用到了正则表达式了. 先来解释一下下面几个正则表达式: String chinese = "^[\\u4E00-\\u9FA5\\uF900-\\uFA2D]+$";                     /**这个正则表达式用来判断是否为中文**/ //用来用户注册.匹配