【JavaScript】浅析javaScript和HTML与unicode字符集的关系

    目录结构:

  1. javaScript和HTML支持的字符集
  2. javaScript和HTML如何表现unicode字符集
  3. 参考文章

javaScript和HTML支持的字符集

JavaScript是支持unicode的。

现代的浏览器在网页中都支持ASCII字符集、ISO字符集、数学符号、希腊字母、其他符号。HTML5默认使用UTF-8。读者可以点击这儿查看ASCII、unicode和utf-8的关系

javaScript和HTML如何表现unicode字符集

HTML页面使用的是网页文档对象,它是通过转义字符串来表现unicode字符集,语法规则为:“第一部分是一个&符号,英文叫ampersand;第二部分是实体(Entity)名字或者是#加上实体(Entity)编号;第三部分是一个分号。”比如:字符“&”可以在HTML中表示为"&"、" &"或是"&"点击这儿查看详情。

javaScript使用的是浏览器系统对象,是十六进制的。它同HTML表现unicode字符集不一样,他有自己的转义字符,javaScript的转义字符表:

Unicode 字符值 转义序列 含义 类别
\u0008 \b Backspace  
\u0009 \t Tab 空白
\u000A \n 换行符(换行) 行结束符
\u000B \v 垂直制表符 空白
\u000C \f 换页 空白
\u000D \r 回车 行结束符
\u0020   空格 空白
\u0022 \" 双引号 (")  
\u0027 \‘ 单引号 (‘)  
\u005C \\ 反斜杠 (\)  
\u00A0   不间断空格 空白
\u2028   行分隔符 行结束符
\u2029   段落分隔符 行结束符
\uFEFF   字节顺序标记 空白

读者可以打开电脑自带的字符映射表,在里面可以找到unicode代码,比如:

在宋体栏目一行中的unicode转到中输入字符串“FE6A”,就会自动跳到百分号,并且在最下面显示“U+FE6A”。

读者可以在html中写出如下测试代码:

<!DOCTYPE html>
<html>
<head>
<title>test.html</title>

<meta name="content-type" content="text/html; charset=UTF-8">

</head>

<body>

<script>
document.write("\ufe6a﹪");
alert("\ufe6a");
</script>
<p>\ufe6a
<p>﹪

</body>

</html>

读者可在浏览器上看到如下效果:

在document文档中的“\ufe6a"和“﹪”都正常显示出来了,这里读者需要注意,前者是javaScript认得到的,所以会被javaScript转化,后者是HTML中的转义字符,因此会原封不动的发给HTML文档,由HTML来转换。上面的代码中有一个alert警告框,它都是支持unicode字符集的,如果在里面写上HTML的转义字符串的话,由于alert的内容不是发送到HTML文档对象中,因此转义字符串将不会被转化。

介绍了javaScript和html表现unicode的差别,如果需要某个符号的unicode代码或是html的转义字符串代码挨着挨着在字符映射表中或是字符集中查找太麻烦了,这时候可以使用在线Unicode编码转换。在使用在线Unicode编码转换的时候,ASCII字符转Unicode字符默认是HTML的转义字符串形式,这也说明HTML的转义字符串也是Unicode编码的一部分,这时候读者可以通过“中文转Unicode”来实现十六进制。

参考文章

http://baike.baidu.com/link?url=kf0Em5vWVn7-WJMda7lfnqrsYR9B0b2ermZ3BMNr369WVAlCzi57oX3ZjxZPe3e-_BZBo4RnSgX7-M9aqmcD3yiJc2lGwTtpcubNJpORSMU8S2WxAbeGH1oaIlu-jT13

http://www.codeweblog.com/javascript%E4%B8%AD%E7%9A%84alert-%E5%87%BD%E6%95%B0%E4%BD%BF%E7%94%A8%E6%8A%80%E5%B7%A7%E8%AF%A6%E8%A7%A3/

http://www.runoob.com/charsets/ref-html-utf8.html

本文为博主原创作品,如需转载请注明出处

时间: 2024-10-27 00:24:00

【JavaScript】浅析javaScript和HTML与unicode字符集的关系的相关文章

【译】每个JavaScript开发者都该懂的Unicode

本文是我(兔子)在众成翻译上认领并翻译的:每个JavaScript开发者都该懂的Unicode (译者注:本文含有Unicode辅助平面的特殊字符,部分浏览器可能无法正确显示,但并不影响理解文章内容.) 在动笔写这篇文章之前,我得先忏悔一下:在很长一段时间里我对Unicode充满了恐惧. 每次遇到需要Unicode知识的编程问题时,我总是找一个hack方案来解决,但解决方案的原理我也不懂. 直到遇见一个需要深入了解Unicode知识才能解决的问题,我才停止了这种逃避.因为这个问题没办法应用特定情

浅析JavaScript和PHP中三个等号(===)和两个等号(==)的区别

先做个简单的介绍,让先有个直观的认识 == equality 等同 === identity 恒等 == 两边值类型不同的时候,要先进行类型转换,再比较. === 不做类型转换,类型不同的一定不等. 举例说明: "1" == true 类型不同,"=="将先做类型转换,把true转换为1,即为 "1" == 1: 此时,类型仍不同,继续进行类型转换,把"1"转换为1,即为 1 == 1: 此时,"==" 左

浅析JavaScript闭包

闭包和原型是javascript语言的两大特点,上篇博文<浅析JavaScript原型>中已经总结了原型 ,今天就总结一下闭包的相关知识. 前言 在开始闭包之前,需要先介绍一下匿名函数和JavaScript垃圾回收机制这两个概念. 匿名函数 匿名函数,很容易理解,就是没有名字的函数. //普通函数 function box(){ return 'This's just a test'; } //匿名函数的架构思想,但是这样写会报错 function (){ return 'This's jus

浅析 JavaScript 中的 函数 currying 柯里化

原文:浅析 JavaScript 中的 函数 currying 柯里化 何为Curry化/柯里化? curry化来源与数学家 Haskell Curry的名字 (编程语言 Haskell也是以他的名字命名). 柯里化通常也称部分求值,其含义是给函数分步传递参数,每次传递参数后部分应用参数,并返回一个更具体的函数接受剩下的参数,这中间可嵌套多层这样的接受部分参数函数,直至返回最后结果.因此柯里化的过程是逐步传参,逐步缩小函数的适用范围,逐步求解的过程. 柯里化一个求和函数 按照分步求值,我们看一个

JavaScript编码转换之gb2312转unicode -- &amp;#X形式

http://www.cnblogs.com/meil/archive/2007/01/31/635936.html JavaScript编码转换之gb2312转unicode 1. <html><head><title>gb2312 unicode转换工具</title><div align=center><center><table border=0 cellpadding=0 cellspacing=0 style=&qu

JavaScript 浅析数组对象与类数组对象

数组(Array对象) 数组的操作 创建数组方法 添加与修改数组元素 删除数组元素 使用数组元素 遍历数组元素 多维数组 数组相关的函数 concat() join() pop() push() shift() unshift() reverse() sort() slice() splice() 类数组对象 定义 举例 对比数组 转换 间接 直接 数组(Array对象) 数组就是一组数据. 在JavaScript中没有数组这种数据类型.数组时对象创建的. 键(下标): 用于区分数组中不同数值的

JavaScript学习——JavaScript语法 语句

JavaScript 语法 JavaScript 是一个脚本语言. 它是一个轻量级,但功能强大的编程语言. JavaScript 字面量 在编程语言中,一般固定值称为字面量,如 3.14. 数字(Number)字面量 可以是整数或者是小数,或者是科学计数(e). 3.14 1001 123e5 字符串(String)字面量 可以使用单引号或双引号: <!DOCTYPE html> <html> <head> <meta charset="utf-8&qu

刨根究底字符编码之十——Unicode字符集的字符编码方式CEF以及码点、码元

Unicode字符集的字符编码方式CEF以及码点.码元 一.字符编码方式CEF的选择 1. 由于Unicode字符集非常大,有些字符的编号(码点值)需要两个或两个以上字节来表示,而要对这样的编号进行编码,也必须使用两个或两个以上字节. 比如,汉字"严"的Unicode码(Unicode码点值.Unicode编号)是十六进制数4E25,转换成二进制数有15位(100 1110 0010 0101),对"严"这个字符的编号进行编码的话,至少需要2个字节.表示其他更大编号

【JavaScript】JavaScript中的陷阱大集合

本文主要介绍怪异的Javascript,毋庸置疑,它绝对有怪异的一面.当软件开发者开始使用世界上使用最广泛的语言编写代码时,他们会在这个过 程中发现很多有趣的“特性”.即便是老练的Javascript开发者也可以在本文找到一些有趣的新陷阱,请留意这些陷阱,当然也可以尽情享受由这些陷阱 带来的“乐趣”! AD: 本文主要介绍怪异的Javascript,毋庸置疑,它绝对有怪异的一面.当软件开发者开始使用世界上使用最广泛的语言编写代码时,他们会在这个过 程中发现很多有趣的“特性”.即便是老练的Java