ECMAScript正则表达式6个最新特性

译者按: 还没学好ES6?ECMAScript 2018已经到来啦!

为了保证可读性,本文采用意译而非直译。另外,本文版权归原作者所有,翻译仅用于学习。

1999年,ECMAScript 3添加了对正则表达式的支持。

16年之后,ECMAScript 6(即ECMAScript 2015或者ES6)引入了Unicode模式(u选项), sticky模式(y选项)以及RegExp.prototype.flags的getter方法

这篇博客将介绍ECMAScript正则表达式的最新特性

1. dotAll模式(s选项)

这个特性已经在ECMAScript 2018正式发布了。

默认情况下,.可以匹配任意字符,除了换行符:

/foo.bar/u.test(‘foo\nbar‘); // false

另外,.不能匹配Unicode字符,需要使用u选项启用Unicode模式才行。

ES2018引入了dotAll模式,通过s选项可以启用,这样,.就可以匹配换行符了。

/foo.bar/su.test(‘foo\nbar‘); // true

2. Lookbehind断言

这个特性已经在ECMAScript 2018正式发布了。

ECMAScript目前仅支持lookahead断言。

下面示例是Positive lookahead,匹配字符串“42 dollars”中紧跟着是"dollars"的数字:

const pattern = /\d+(?= dollars)/u;
const result = pattern.exec(‘42 dollars‘);
console.log(result[0]); // 打印42

下面示例是Negative lookahead,匹配字符串“42 pesos”中紧跟着的不是"dollars"的数字:

const pattern = /\d+(?! dollars)/u;
const result = pattern.exec(‘42 pesos‘);
console.log(result[0]); // 打印42

ES2018添加了lookbehind断言

下面示例是Positive lookbehind,匹配字符串“$42”中前面是"$"的数字:

const pattern = /(?<=\$)\d+/u;
const result = pattern.exec(‘$42‘);
console.log(result[0]); // 打印42

下面示例是Negative lookbehind,匹配字符串“$42”中前面不是是"$"的数字:

const pattern = /(?<!\$)\d+/u;
const result = pattern.exec(‘€42‘);
console.log(result[0]); // 打印42

Fundebug专注于网页、微信小程序、微信小游戏,支付宝小程序,React Native,Node.js和Java线上BUG实时监控,欢迎免费试用

3. Named capture groups

这个特性已经在ECMAScript 2018正式发布了。

目前,正则表达式中小括号匹配的分组是通过数字编号的:

const pattern = /(\d{4})-(\d{2})-(\d{2})/u;
const result = pattern.exec(‘2017-01-25‘);
console.log(result[0]); // 打印"2017-01-25"
console.log(result[1]); // 打印"2017"
console.log(result[2]); // 打印"01"
console.log(result[3]); // 打印"25"

这样很方便,但是可读性很差,且不易维护。一旦正则表达式中小括号的顺序有变化时,我们就需要更新对应的数字编号。

ES2018添加named capture groups, 可以指定小括号中匹配内容的名称,这样可以提高代码的可读性,也便于维护。

const pattern = /(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/u;
const result = pattern.exec(‘2017-01-25‘);
console.log(result.groups.year); // 打印"2017"
console.log(result.groups.month); // 打印"01"
console.log(result.groups.day); // 打印"25"

4. Unicode property escapes

这个特性已经在ECMAScript 2018正式发布了。

Unicode标准为每一个字符分配了多个属性。比如,当你要匹配希腊语字符时,则可以搜索Script_Extensions属性为Greek的字符。

Unicode property escapes使得我们可以使用ECMAScript正则表达式直接匹配Unicode字符的属性:

const regexGreekSymbol = /\p{Script_Extensions=Greek}/u;
console.log(regexGreekSymbol.test(‘π‘)); // 打印true

5. String.prototype.matchAll

这个特性还处在Stage 3 Draft

g和y选项通常用于匹配一个字符串,然后遍历所有匹配的子串,包括小括号匹配的分组。String.prototype.matchAll让这个操作变得更加简单了。

const string = ‘Magic hex numbers: DEADBEEF CAFE 8BADF00D‘;
const regex = /\b[0-9a-fA-F]+\b/g;
for (const match of string.matchAll(regex)) {
    console.log(match);
}

每一个迭代所返回的match对象与regex.exec(string)所返回的结果相同:

// Iteration 1:
[
    ‘DEADBEEF‘,
    index: 19,
    input: ‘Magic hex numbers: DEADBEEF CAFE 8BADF00D‘
]

// Iteration 2:
[
    ‘CAFE‘,
    index: 28,
    input: ‘Magic hex numbers: DEADBEEF CAFE 8BADF00D‘
]

// Iteration 3:
[
    ‘8BADF00D‘,
    index: 33,
    input: ‘Magic hex numbers: DEADBEEF CAFE 8BADF00D‘
]

注意,这个特性还处在Stage 3 Draft,因此还存在变化的可能性,示例代码是根据最新的提案写的。另外,浏览器也还没有支持这个特性。String.prototype.matchAll最快可以被加入到ECMAScript 2019中。

6. 规范RegExp遗留特性

这个提案还处在Stage 3 Draft

这个提案规范了RegExp的遗留特性,比如RegExp.prototype.compile方法以及它的静态属性从RegExp.$1RegExp.$9。虽然这些特性已经弃用(deprecated)了,但是为了兼容性我们不能将他们去。因此,规范这些RegExp遗留特性是最好的方法。因此,这个提案有助于保证兼容性。

参考

关于Fundebug

Fundebug专注于JavaScript、微信小程序、微信小游戏、支付宝小程序、React Native、Node.js和Java实时BUG监控。 自从2016年双十一正式上线,Fundebug累计处理了6亿+错误事件,得到了Google、360、金山软件等众多知名用户的认可。欢迎免费试用!

版权声明:

转载时请注明作者Fundebug以及本文地址:

https://blog.fundebug.com/2018/08/30/ecmascript-regular-expression-new-features/

原文地址:https://www.cnblogs.com/fundebug/p/es6_new_regx_features.html

时间: 2024-11-07 07:36:59

ECMAScript正则表达式6个最新特性的相关文章

iOS Sprite Kit最新特性Physics Field虚拟物理场Swift測试

在WWDC2014上,Sprite Kit又有了非常多新的提升! 当中一个非常有意思的东西就是Physics Field!也就是物理场! 这意味着我们在Sprite kit上编写虚拟物理场的游戏将变得非常easy! 这里我依据WWDC2014上What's new in Sprite kit的官方视频上的DEMO, 用Swift语言自己做了一个Demo. 截图例如以下: 先放上GitHub链接: https://github.com/songrotek/PhysicsFieldsWorld.gi

iOS Sprite Kit最新特性Physics Field虚拟物理场Swift测试

在WWDC2014上,Sprite Kit又有了很多新的提升! 其中一个很有意思的东西就是Physics Field!也就是物理场! 这意味着我们在Sprite kit上编写虚拟物理场的游戏将变得非常简单! 这里我根据WWDC2014上What's new in Sprite kit的官方视频上的DEMO, 用Swift语言自己做了一个Demo. 截图如下: 先放上GitHub链接: https://github.com/songrotek/PhysicsFieldsWorld.git 我另外录

ASP.NET MVC最新特性

问题: 既然我说对ASP.NET MVC很熟很懂,对新技术很感兴趣,那么问题是: 当前最新版MVC是什么?你用的哪个版本?相比前一个版本有什么新的特性? --- 答案:TBD 解析: 在面试的时候,为了争取面试官的好感,显示自己的自信,在显露自己在某个方面的能力的时候要小心,很可能为自己挖一个大坑,当然除非是你对这个真的很熟很懂,说到底还是要提高自己的能力和研究技术或问题的深度,否则不要轻易的去吹嘘,否则被戳破了会很难堪,下不了台,反而给面试官留下华而不实的印象:要记住面试官先天的会对你说的话,

Java EE8的五大最新特性

备受期待的 Java Enterprise Edition 8 发布了两个令人兴奋的全新 API (JSON-Binding 1.0 和 Java EE Security 1.0),并改进了现有的API(JAX-RS 2.1,Bean Validation 2.0,JSF 2.3,CDI 2.0,JSON-P 1.1,JPA 2.2 以及 Servlet 4.0).这是 Oracle 的企业级 Java 平台近四年以来第一次发布新版本,其中包含了数百项新特性.功能升级和错误修复. 哪些新特性是最

ECMAScript各个版本简介及特性

术语 ECMAScript Sun(现在的Oracle)公司持有着"Java"和"JavaScript"的商标.这就让微软不得不把自己的JavaScript方言称之为"JScript".然后,在这门语言被标准化的时候,就必须使用一个与二者都不同的名字."ECMAScript"就这样诞生了,这个名字的来由是因为执行标准化的组织是Ecma国际.通常来说,术语"ECMAScript"和"JavaScri

解决从pip上下载的最新flask版本不能运行flaskr和最新特性的问题

由于在测试flask的单元测试.所以准备弄个环境,查询官方文档发现flask源码里面有一个example文件夹里面有个flaskr应用 可供测试 看了一下readme文档,大致是这样 / Flaskr / a minimal blog application ~ What is Flaskr? A sqlite powered thumble blog application ~ How do I use it? 1. edit the configuration in the flaskr.p

AFNetworking 3.0x版本最新特性

AFNetworking是一款在OS X和iOS下都令人喜爱的网络库.为了迎合iOS新版本的升级, AFNetworking在3.0版本中删除了基于 NSURLConnection API的所有支持.如果你的项目以前使用过这些API,建议您立即升级到基于 NSURLSession 的API的AFNetworking的版本.本指南将引导您完成这个过程. 本指南是为了引导使用AFNetworking 2.x升级到最新的版本API,以达到过渡的目的,并且解释了新增和更改的设计结构. 新设备要求: iO

C# 6和 VB 12的最新特性列表

随着下个版本的C#发布日逐渐临近,那些还没有完成的特性必须被砍掉.最近从特性列表中被砍掉的特性包括主要构造函数(primary constructor)和声明表达式(declaration expression).Mads Torgersen写道: 正如我之前所说的一样,语言特性在这次发布中只是第二等级的考虑.这次发布的主要目标是出色地完成Roslyn价值命题的首个发布,包括在IDE中对语言特性更深入的理解,以及让所有人都可以通过一套健壮和完善的API进行访问.为了更好地实现这次提交的内容,我们

C#和VB新版本的最新特性列表

随着下个版本的 C# 发布日逐渐临近,那些还没有完成的特性必须被砍掉.最近从特性列表中被砍掉的特性包括主要构造函数(primary constructor)和声明表达式(declaration expression). 好 在并不是只有坏消息,一个之前从未被微软提到过的新特性即将随C# 6 发布,这就是字符串值插入(string interpolation),该特性允许开发者对字符串直接进行内联,而无需显式地调用 String.Format 方法.字符串值插入在 2009 年时曾作为一个实验性特