unicode编码的各种表示方式,不断更新中!

unicode编码的各种表示方式,不断更新中!

格式一:&#XXXX;&#XXXX;

示例:您好

结果:您好

格式二:\uXXXX\uXXXX

示例:\u60a8\u597d

结果:您好

格式三:&#DDDDD;&#DDDDD;

示例:您好

结果:您好

贴一段转unicode编码的JS代码,用于转换各种结果的方法

//convtype为转换类型,转换类型为我上文中提到的4中,code为需要转换的字符串
function myconf(convtype,code){
	switch(convtype){
		case "totype1":
			return ascii(code);
		case "totype2":
			return unicode(code);
		case "totype3":
			return unicode1(code);
		case "tohanzi":
			return reconvert(code);
	}
}
function ascii(str){
	var value='';
	for (var i = 0; i < str.length; i++)
	    value += '\&#x' + parseInt(str.charCodeAt(i)).toString(16)+';';
	return value;
}
function unicode(str){
	var value='';
	for (var i = 0; i < str.length; i++)
	    value += '\\u' + parseInt(str.charCodeAt(i)).toString(16);
	return value;
}
function unicode1(str){
	var value='';
	for (var i = 0; i < str.length; i++)
	    value += '&#' + str.charCodeAt(i) + ';';
	return value;
}
function reconvert(str){
	str = str.replace(/(\\u)(\w{1,4})/gi,function($0){
	return (String.fromCharCode(parseInt((escape($0).replace(/(%5Cu)(\w{1,4})/g,"$2")),16)));
	});
	str = str.replace(/(&#x)(\w{1,4});/gi,function($0){
	return String.fromCharCode(parseInt(escape($0).replace(/(%26%23x)(\w{1,4})(%3B)/g,"$2"),16));
	});
	str = str.replace(/(&#)(\d{1,6});/gi,function($0){
	return String.fromCharCode(parseInt(escape($0).replace(/(%26%23)(\d{1,6})(%3B)/g,"$2")));
	});
	return str;
}
时间: 2024-10-13 23:26:56

unicode编码的各种表示方式,不断更新中!的相关文章

16进制、编码(编码问题随理解深入持续更新中)

16进制: 十进制转换成8进制: oct ( 数字) 十进制转换成16进制:  hex( 数字) CPU.内存.硬盘我们看到都是采用的16进制计算. 一个字节(byte)能够用2个16进制的数来表示.4个2进制对应1个16进制. 编码: 所有的系统.编程语言都默认支持Unicode. UTF-8/GBK... --> decode 解码 --> Unicode Unicode --> encode 编码 --> GBK / UTF-8 .. 假设某Python文件是以UTF-8保存

奇葩的对象创建方式(更新中)

1.日志对象的创建方式 public static final Logger  log =Logger.getLogger(需要产生日志文件的class对象); 2.httpClient对象的创建方式 CloseableHttpClient httpclient = HttpClients.createDefault(); 3.获取一个Http返回的对象 CloseableHttpResponse response = httpClient.execute(get);

css布局 - 垂直居中布局的一百种实现方式(更新中...)

首先将垂直居中的现象和实现方式两大方向细分类如下: 接下来逐条累加不同情况下的垂直居中实现. 目录: 一.父元素高度固定时,单行文本 | 图片的垂直居中 1. line-height行高简单粗暴实现法:line-height:Npx(N = 与元素高度相同的值) 2. vertical-middle上场: 二.父元素高度固定时,多行文本的垂直居中 1. 帮多行文本找一个继父来领养他,让继父弥补父元素给他带来的伤害(行高和水平居中对齐的样式修改) 2. margin负边距简单处理一下底部小“裂痕”

兼容性问题的解决方式(更新中&#183;&#183;&#183;)

1.清除浮动的兼容性(低版本的浏览器不兼容问题) .clearfix:after{ content:""; clear:both; display:block; visibility:hidden; height:0; } .clear{       *zoom:1; } 2.透明度的兼容性 opacity:0.3; filter:alpha(opacity=30); 3.各种国外浏览器在CSS3中的兼容问题 国内的浏览器的内核都是谷歌 Chrome的前缀-webkit- Firefo

Java与编码问题串讲之二–如何理解java采用Unicode编码

Java开发者必须牢记:在Java中字符仅以一种形式存在,那就是Unicode(不选择任何特定的编码,直接使用他们在字符集中的编号,这是统一的唯一方法).由于java采用unicode编码,char 在java中占2个字节.2个字节(16位)来表示一个字符. 这里的Java中是指在JVM中.在内存中.在代码里声明的每一个char.String类型的变量中. 例如: 1 2 3 4 5 6 7 System.out.println(System.getProperty("file.encoding

[C语言]Unicode编码(二)-中文字符刷选

Unicode编码(二)-中文字符刷选 1,UTF-8编码中三字节中文字符的刷选方法如下: int chinese_filter(unsigned char one, unsigned char two ) {     int flag = -1;     if ( one >= 0x4E && one < 0x9F )     {         flag = 1;     }     else if ( one == 0x9F && two <= 0x

ASCII、ANSI、Unicode编码

3.1 ASCII编码 以下来自"维基百科": ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)是基于拉丁字母的一套电脑编码系统.它主要用于显示现代英语,而其扩展版本EASCII则可以勉强显示其他西欧语言.它是现今最通用的单字节编码系统(但是有被UniCode追上的迹象),并等同于国际标准ISO/IEC 646. ASCII第一次以规范标准的型态发表是在1967年,最后一次更新则是在1986年,至今

Unicode编码的原型

Unicode编码定义了这个世界上几乎所有字符(就是你眼睛看到的长那个样子的符号)的数字表示 也就是说Unicode为每个字符发了一张身份证,这张身份证上有一串唯一的数字ID确定了这个字符 在这个纷乱世界上存在的唯一性.Unicode给这串数字ID起了个名字叫[码点](Code Point) 而很多人说的编码其实是想表达[Unicode转换格式](即UTF,Unicode Transformation Formats) 有没有觉得眼前一亮豁然开朗?没错 这就是我们看到的UTF-8/UTF-16/

ASCII,Utf8,Unicode编码下的中英文字符大小

一,测试Demo namespace 不同编码下的中英文字符大小 { class Program { static void Main(string[] args) { ShowCode(); } private static void ShowCode() { string[] strArray = { "b","abc","乙","甲乙丙丁"}; byte[] buffer; string mode, back; fore