幽灵般的存在:零宽空白

最近在用AngularJS进行开发时遇到了灵异事件,从某网站拷贝下来的看似无比正确的代码运行总是出错。

经验告诉我们,看上去正确的代码可能实际上并不正确。我是指字符层面上。其中可能存在乱码,存在奇怪的空白字符,这些均会导致问题。

然而我仔细检查了一番,并未发现乱码和多余空格。唯一的异常情况是,AngularJS的插值字符串{{xxx}}在Visual Studio中的代码着色不太对。在安装了VS的最新Web工具后,这插值字符串中xxx应当被编辑器识别并显示紫色,{{和}}会加粗显示,但是这一段粘贴来的代码中它们仍显示蓝色,和正常HTML attribute一样。

我起初并未放在心上,以为这只是VS的一个小bug。但诸般走投无路后,我开始重新审视这个异常。当我尝试就地手打一个{{进去并观察到正确的加粗、着色后,我认为目标已锁定。

我复制了这个手打的{{并粘贴取代原来的“{{”,那着色一下子就正常了。替换了所有的插值字符串后,程序运行完全正常了。

很明显,这看上去完全一样的“{{”是不同的字符。在Chrome Console中检验相等性,返回false。

但到了这一步,我的思维还未达到。我推断其中至少有一个{不同。用charCodeAt()函数检验一下,果然,charCodeAt(0)为123,这是正常的{符号无疑;charCodeAt(1)返回8203,这是个什么鬼!是{的孪生兄弟吗?

不是的。查找资料后得知,这个字符叫做Zero Width Space,中文可称为“零宽空白”。看到这里我恍然大悟,原来之前我一直被骗了,那个邪恶的字符串居然不是你看到的两个字符,而是三个。参见维基百科

http://zh.wikipedia.org/wiki/%E7%A9%BA%E6%A0%BC

8203字符即其中的U+200B。

一个有趣的JSFuck式的应用见

http://ucren.com/blog/archives/549

http://mn.tn/dev/z.js/

这个字符在主流文本编辑器中均没有任何显示效果,就像一只看不见、摸不着的幽灵。我一般习惯让文本编辑器显示空白字符,以区分普通空白、制表符、换行符等,但是遇到这个零宽空白,我真是给跪了。

时间: 2024-10-02 23:27:43

幽灵般的存在:零宽空白的相关文章

正则表达式(二) - 零宽断言与懒惰匹配以及平衡组

小括号的作用 分类 代码/语法 说明 捕获 (exp) 匹配exp,并捕获文本到自动命名的组里 (?<name>exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp) (?:exp)   匹配exp,不捕获匹配的文本,也不给此分组分配组号 零宽断言 (?=exp) 匹配exp前面的位置 (?<=exp)  匹配exp后面的位置 (?!exp)  匹配后面跟的不是exp的位置 (?<!exp) 匹配前面不是exp的位置 注释 (?#comment)

JS不支持正则中的负向零宽断言

今天在项目中用到了正则表达式,并且需要用负向零宽断言 (?<=exp) 进行筛选,结果运行时报 Invalid group 错,一开始以为是自己很久没用表达式写错了,查阅了一下正则语法后发现并没有写错. 到网上一搜才发现,JS不支持负向的 (?<=exp) 和 (?<!exp),只支持正向的(?=exp) 和 (?!exp).

零宽断言详解

零宽断言的意思是(匹配宽度为零,满足一定的条件/断言) 我也不知道这个词语是那个王八蛋发明的,简直是太拗口了. 零宽断言用于查找在某些内容(但并不包括这些内容)之前或之后的东西,也就是说它们像 \b ^ $ \< \> 这样的锚定作用,用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言. 断言用来声明一个应该为真的事实.正则表达式中只有当断言为真时才会继续进行匹配. 其中零宽断言又分四种: 1) 先行断言   也叫零宽度正预测先行断言(?=exp)   --  表

Regex 正则零宽断言

http://baike.baidu.com/link?url=sLfovpZmIcS5Uz_tiidXoVtjl30Tu3wARMfhnEcbgEGzsb8g1z7dvtGNXTulu1KDodmiuTAP5ODr_R5D2myeeq 零宽断言 1_1.(?=exp)   零宽度正预测先行断言,它断言自身出现的位置的后面能匹配表达式exp 1_2.(?<=exp) 零宽度正回顾后发断言,它断言自身出现的位置的前面能匹配表达式exp 负向零宽 2_1.(?!exp)零宽度负预测先行断言,断言此位

js正则之零宽断言

我们学到的正则表达式匹配,都是有“宽度”的,使用 \w+. 匹配下面文本,会将 . 一同匹配: regular. expression. 如果不想匹配符号,只匹配一个位置,就要用到“零宽断言”(匹配宽度为零,满足一定的 条件/断言),零宽断言使用 (?=表达式) 的语法,例如 \w+(?=.),其中 (?=.) 表示 . 前面的位置(先行断言) regular. expression. 如果需要匹配后面的位置,如: .regular .expression 则要用到后发断言 (?<=.) ,使用

Java正则零宽断言出现PatternSyntaxException异常

今天在写正则的时候发现Java正则使用零宽断言(?<!exp) 匹配前面不是exp的位置,报出了一个异常: Exception in thread "main" java.util.regex.PatternSyntaxException: Look-behind group does not have an obvious maximum length near index 26 (?<=<img[^>]*src="[^"]*")

老男孩带你了解perl正则表达式中的零宽断言

老男孩IT教育小编为大家整理了perl正则表达式中的零宽断言的方法,希望能帮到大家 1.1 前言 本文只介绍perl语言正则表达式的零宽断言功能. 零宽断言实质:匹配文本里面的位置. 零宽断言叫zero-length assertions,也叫lookaround(这个更容易理解). 包括:lookahead(向前看,零宽度正预测先行断言),lookbehind(向后看,零宽度正回顾后发断言). 从左到右对文本进行匹配,判断是否符合exp表达式. 名字 表达式 如果子表达式成功则- positi

环视-顺序肯定环视-零宽断言-正向预查-反向预查

断言用来声明一个应该为真的事实.正则表达式中,只有当断言为真时才会继续进行匹配.断言匹配的是一个事实,而不是内容.本文介绍四个断言,它们用于查找在某些内容(但并不包括这些内容)之前或之后,也就是一个位置(如\b.^.$)应该满足的一定条件(即断言),因此也称为零宽断言. 顺序肯定环视(?=exp) 零宽度正预测先行断言,又称顺序肯定环视,断言自身出现位置的后面能匹配表达式exp. 比如,匹配以"ing"结尾的单词前面部分(除了"ing"以外的部分(通俗说:首先,要匹

正则表达式的零宽断言

零宽断言,大多地方这样定义它,用于查找在某些内容(但并不包括这些内容)之前或之后的东西,也就是说它们像 \b ^ $ \< > 这样的锚定作用,用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言.我的理解是在一个限定位置的字符串之前或之后进行匹配查找.所以零宽断言,执行过程分两种情况,如果是正向断言,应该是这样的,第一步,判断判断断言是否为真(即是否满足一定条件)第二步,如果满足条件,则进行下一步查找匹配.如果是反向断言,第一步还是按照正则表达式顺序去匹配.第二步