固化分组

1、考虑下面的需求，使用[a-zA-Z]+: 去匹配文本，对于文本Subject，分析匹配过程。
2、[a-zA-Z]+匹配优先，一直吃到t，发现冒号不能匹配，于是使用备用状态，吐出一个字符，
　　还是不能匹配，再吐出一个字符......一直继续下去。
3、这里存在问题，引擎试图吐出一个字符匹配冒号，我们知道这是徒劳的尝试。因为[a-zA-Z]+没有吃下去冒号，当然不可能吐出冒号。
　　如果正则表达式引擎足够聪明，意识到这一点，就不需要尝试吐出字符，直接报告匹配失败，也就是说，之前的备用状态应该丢弃。
　　但是，一般情况下，引擎没有这么聪明，需要人为的协助，提示引擎不需要吐出字符，也就是丢弃之前的备用状态。
4、怎么提示引擎呢？
　　使用固化分组，如下
　　(?>[a-zA-Z]+): (?>[a-zA-Z]+)作为一个整体，吃下去文本，即使后面匹配失败，也不吐出来。
5、也就是说，使用固化分组可以提前报告匹配失败，不需要进行徒劳的尝试，提高效率。
6、对于不支持固化分组的程序，可以使用占有优先和环视。
　　占有优先，如下 ([a-zA-Z]++):
　　环视匹配一个位置，有一个重要的特点，就是匹配尝试结束后，不会留下任何备用状态，因此，使用环视解决上面的问题，如下：
　　(?=([a-zA-Z]+))\1: (?=([a-zA-Z]+))匹配一个位置，右边是([a-zA-Z]+)，\1反向引用([a-zA-Z]+)，后面跟着一个冒号。

时间： 2024-08-01 19:09:22

固化分组的相关文章

Regex阅读笔记(三)之固化分组

符号:?> 使用?>的匹配与正常的匹配无区别,但是如果匹配进行到此结构之后,此结构体的所有备用状态都会放弃,也就是括号内的子表达式中未尝试过的备用状态都不复存在了. 例如'(\.\d\d(?>[1-9]?))\d+',在固化分组内,量词能够正常工作,如果[1-9]不能匹配,正则表达式会返回?留下的备用状态,然后匹配脱离固化分组,继续前进到\d+,在这种情况下,当控制权离开固化分组时,没有备用状态需要放弃(因为没有在固化分组中创建任何备用状态) 如果[1-9]能匹配,匹配脱离固化分组以后,

刨根究底正则表达式之零——前言

前言一.缘起 1. 前面在字符编码系列文章的前言中曾说过,类似于字符编码这样基础.重要.应用广泛而又特别容易让人困惑的主题还有字节序(即大小端表示).正则表达式以及浮点数实现.日期时间处理等等.其中,字节序.正则表达式跟字符编码的关系非常密切.字符编码以及字节序的问题已经在字符编码系列文章中介绍过了,这个系列再来讨论正则表达式. 不同于字符编码,正则表达式目前市面上并不缺乏专业著作,比如那本被誉为正则表达式学习圣经的<精通正则表达式>就很值得一读,另外该书的译者余晟先生所写的<正则指引

刨根究底正则表达式之二——正则表达式基础

正则表达式基础一.正则表达式构成 1. 正则表达式中的语法元素,从是否具有特殊含义的角度进行分类,可分为下列两大类.共五种语法元素: 1)不具有特殊含义的语法元素 (1) 字面字符(文本字符):不具有特殊含义的单个字符,代表字符自身(即字符字面值): (2) 普通转义序列:由转义前导符\后跟元字符所组成的字符序列,将具有特殊含义的元字符,转义为(即转换为)不具有特殊含义的字符本身(即字符字面值): 2)具有特殊含义的语法元素 (1) 元字符:具有特殊含义的单个字符,包括:\.(.).[.

正则学习（1）--- 基本规则总结

在正则表达式的使用上,俺一直在打游击,是时候来个总结了.由于愚笨等不可抗拒的原因,只能选简单的说,只写下对ASCII编码字符的匹配和php相关的,其他的Unicode的和其他不同流派的,以后碰到了再学习下就行,应付平常的应该够了. 首先需要接受正则的概念,它是用来寻找文本的一种规则,简单的文本检索,比如字符串查找strpos,只是简单的查找某一串字符的出现,只要稍微变动下需求,比如要查找这样5个字符,前面两个是数字,后面3个是字母,且忽略大小写,如果单纯用字符串查找等方法做,显得很麻烦,而用正则

preg_match()——php

第一,让我们看看两个特别的字符:‘^’和‘$’他们是分别用来匹配字符串的开始和结束,以下分别举例说明: "^The": 匹配以 "The"开头的字符串; "of despair$": 匹配以 "of despair" 结尾的字符串; "^abc$": 匹配以abc开头和以abc结尾的字符串,实际上是只有abc与之匹配: "notice": 匹配包含notice的字符串: 你可以看见如果你

正则基础之——贪婪与非贪婪模式

转载自:http://blog.csdn.net/lxcnn/article/details/4756030 1 概述贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为,贪婪模式在整个表达式匹配成功的前提下,尽可能多的匹配,而非贪婪模式在整个表达式匹配成功的前提下,尽可能少的匹配.非贪婪模式只被部分NFA引擎所支持. 属于贪婪模式的量词,也叫做匹配优先量词,包括: “{m,n}”.“{m,}”.“?”.“*”和“+”. 在一些使用NFA引擎的语言中,在匹配优先量词后加上“?”

《精通正则表达式》笔记 --- 选择引号内的文字

这个例子出自<精通正则表达式>,做一下笔记帮助理解和记忆. 第一版最简单的case就是考虑包含一对引号,那么写出来的表达式应该是这样的: ".*" 但是这个未免太简单了吧,会有啥问题呢?假如输入的字符串长这样结果就会出问题拉.see... Input String: "Hello" and "World" Regex: ".*" Match: "Hello" and "World&q

正则表达式的环视和匹配

环视环视匹配的最终结果就是一个位置,有四种类型的环视: (?=Expression) 顺序肯定环视,表示所在位置右侧能够匹配Expression (?!Expression) 顺序否定环视,表示所在位置右侧不能匹配Expression (?<=Expression) 逆序肯定环视,表示所在位置左侧能够匹配Expression (?<!Expression) 逆序否定环视,表示所在位置左侧不能匹配Expression 可以用以下两个正则表达式理解环视: (1)字母.数字.特殊符号全部出现,至少

linux之正则表达式篇

shell环境设定 shell也是一个应用程序,工作在用户模式,运行表现为一个进程,通过pstree可以查看到bash进程. shell 进程用于通过命令行界面,类似windows的explore资源管理器. bourn:开发shell ,bsh-->sh BSD:研发csh korn:研发ksh(商业版,功能强大). bash-->bourn again shell,Bash-->开源,bsh的增强版 shell本身是解释器,能够理解其他命令,并且让命令执行起来.理解语句,更具流程控制

猜你喜欢

html5--基础笔记

1.对于<a>标签以前: <h2><a href="index.html">The home page</a></h2> ...

ZOJ 3818 Pretty Poem

暴力模拟细节处理很重要... 1 #include <iostream> 2 #include <cstring> 3 #include <cstdio> 4 u ...

C# 注册表Regedit读写

注册表的读写 1.读 public static string GetRegeditData() { //Win10 读写LocalMachine权限,没有访问权限 RegistryKey hkml ...

框架开发(六)----缓存类

一理论补充缓存是临时开辟出来的一块存放数据的区域, 这样在下一次取数据的时候就可以直接去取了. 因为内存的材质相对于硬盘的读写明显优越性,而且SDRAM等的性价比高,缓存最好保存在内存里.PHP中 ...

对DataTable进行分组

因为程序的特殊情景,需要在sql查出来的DataTable进行分组,DataTable分组可以使用linq,也可以自己写分组程序. linq相对简单: cmd.CommandText = sql; c ...

使用Openfiler2.99为Esxi主机添加iscsi 共享存储

背景介绍当做实验需要用到共享存储的时候,openfiler是一款模拟共享存储不错的选择,以下就来介绍一下使用openfiler 2.99软件模拟共享存储的过程.Cluster设置如图所示:每台esx ...

linux下奇怪的“重名”文件

是这样的,文件创建是通过远程命令来进行的. 就是在表单中输入命令,然后使用php的system来执行. 表单使用的是多行文本输入框. 可能某次使用类似touch这种命令创建文件的时候多按了一次回车, ...

数据库连接字符串

数据库连接 1.在文件App.config内添加连接 1 <?xml version="1.0" encoding="utf-8" ?> 2 < ...

mysql语句在客户端与服务端的基本使用

http://www.cnblogs.com/1314wamm/p/6016361.html [MySQL]MySQL服务器与客户端的区别

IOS百度地图之--->第二篇《大头针__简单使用及自定义》

呵呵!大家不要只看帖不回帖么,要不然我都没有积极性了. 第一步:创建一个用来呈现mapview的viewcontroller,不废话直接贴代码 ? ? ? ?BasicMapViewControlle ...

Atlas 安装和配置

Atlas是由 Qihoo 360, Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目.它在MySQL官方推出的MySQL-Proxy 0.8.2版本的基础上,修改了大量bu ...

笔试、面试重点总结：WIN32、MFC与Linux

WIN32 1. Win32应用程序的基本类型. 2. 创建win32窗口程序的几个步骤,及使用到的函数. 3. nmake 与 makefile. 4. 有哪些字符集? Win32对于各种字符集如何 ...

windows 10常用快捷键举例

贴靠窗口:Win+左/右+Win+上/下:窗口可以变为1/2或1/4大小放置在屏幕的四个角落: 切换窗口:Alt+Tab:多窗口时使用左右控制方向: 任务视图:Win+Tab:松开键盘界面不会消失: ...

TCP学习之五：客户端、服务端异步传输字符串

参考学习张子阳大神的博客:http://www.cnblogs.com/JimmyZhang/category/101698.html 消息发送接口: 消息接收接口: 客户端: 服务端: 消息发送类: ...

Toad 使用中遇到的问题

1:智能提示: 视图-->toad选项-->Editor-->Code Assist-->Toad Insight---->sort pick list alphabet ...

微社区部署（2）：服务器部署MySql数据库

写在前面:单独写部署MySql原因是,我这边的应用数据库都是独立存在的,数据与应用分别部署在不同的服务器.另外我也没有实际部署MySql的经验,特意写一篇日志,张记性.安装MySql参考了http:/ ...

Spring mvc UEditor jsp版本

此文章主要解决在spring mvc 框架模式下面使用UEditor 图片或者文件上传成功读取不到的bug说明(主要已官方文档为主). 1.项目中应用UEditor.(jsp版本) 1.1参考官方 h ...

更快更简单更美观——Power-BI V9.0隆重发版

继Power-BIV8.0发布后,经过11个月的精心准备,Power-BI V9.0隆重发布!Power-BI V9.0在原有基础上,在软件操作性.美观性.易用性.效率等方面进行了不断地完善与提升,让 ...

ORACLE EXP命令

本文对Oracle数据的导入导出 imp ,exp 两个命令进行了介绍, 并对其对应的參数进行了说明,然后通过一些演示样例进行演练,加深理解.文章最后对运用这两个命令可能出现的问题(如权限不够,不同o ...

canvas生成刻度尺

ruler.js$.fn.ruler = function(opt) { var _default = { width:400, height:70, ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.