Search Engine —— Regular Expression(Spider)

Regular Expression,即正则表达式:用来查找符合某些负责规则的字符串的需要。它真是用于描述这些规则的工具。

1. \b 是一个元字符,用来匹配一个位置,代表着单词的开头或结尾,也就是单词的分界处。如 \bhi\b就会找到文章中所有的‘hi‘的单词;

2. 你要找的是hi后面不远处跟着一个Lucy. 这时,你应该使用 \bhi\b.*\bLucy\b 。这里 * 也是一个元字符,指数量,表示前面的内容可以连续重复使用任意次以使整个表达式得到匹配。. 也是一个元字符,匹配除了换行符意外的任意字符。

3. 0\d\d-\d\d\d\d\d\d\d\d 匹配这样的字符串:以0开头,后面接两个数字,然后是接线符-,最后是8个数字。其中,\d 也是一个元字符,匹配一位数字。前面的字符串可以简写为: 0\d{2}-\d{8}. 2与8表示前面的\d连续匹配2次或者8次。

参考链接:http://deerchao.net/tutorials/regex/regex.htm

时间: 2024-10-18 10:30:46

Search Engine —— Regular Expression(Spider)的相关文章

外文翻译——JavaScript Tutorial——Regular Expression——(1)

原文地址:http://javascript.info/tutorial/regexp-introduction 简介 正则表达式有非常强大的用于字符串“查找”和“替换”的功能.在JS中,它被集成在字符串方法:search, match和replace中. 正则表达式,由一个pattern(匹配规则)和flags(修饰符—可选)组成. 一个基本的正则匹配跟子串匹配一样.斜杠"/"包围的字符串可以创建一个正则表达式. 1 regexp = /att/ 2 3 str = "Sh

外文翻译——JavaScript Tutorial——Regular Expression——(2)

字符类 假设我们要在字符串中查找一个数字.不是指定的数字,而是任意数字,比如:在"Only 1"中查找"1",在"Give me a 5"中查找"5". 子串匹配可以在循环中用来查找0-9中的所有数字.但是采用正则式可以更优雅地处理这种情况. 正则式可以利用字符类代替具体的字符. 例如,正则式中用"\d"来表示任意数字.下面例子中匹配了一个数字: 1 showMatch( "I'm 5 years

外文翻译——JavaScript Tutorial——Regular Expression——(4)

修饰符 一个正则式可能包含一个能影响搜索结果的修饰符. JS中有3个修饰符: g:查找所有结果: i:结果忽略大小写: m:多行匹配模式: 修饰符放在参数后面,如:/.../g. 没有全局修饰符的正则式只返回第一个匹配值: 1 alert( "123".match( /\d/ )) // '1' 如果有全局修饰符,所有匹配值都会被返回: 1 alert( "123".match( /\d/g )) // '1', '2', '3' 多个修饰符也是可行的.比如:忽略大

外文翻译——JavaScript Tutorial——Regular Expression——(3)

特殊字符 在正则式中,有些字符有特殊的用法:[ \ ^ $ . | ? * + ( ). 因为用来增强正则式的匹配功能,所以它们很特殊.不要尝试去记忆它们,等我们都用过以后,你就能轻松记住了. 要把特殊字符当普通标识使用,就必须转义.也就是说,需要在前面加上反斜杠. 比如,我们要查找点".".在正则式中,它代表除换行符以外的所有字符. 所以我们需要转义它: 1 showMatch( "Chapter 5.1", /\d\.\d/ ) // 5.1 如果不转义,&qu

ArcGIS Engine生成等值线(C#)

原文:ArcGIS Engine生成等值线(C#) 本文介绍c#写的利用ArcGIS Engine生成等值线的方法. c#写的根据雨量站的降雨量值内插出降雨量等值线的功能.做几点说明:根据离散点生成等值线:(1)判断等值线shapefile图层临时存放路径是否存在,如果不存在则创建,如果存在并不为空则删除重建:(2)加[降雨量]字段并赋值,生成等值线后删除所加字段:(3)根据所选的字段利用IDW内插生成raster,再设定间距生成contour并标注. ---------------------

Does FTK index search support regular expression?

Some of my friends ask me a question: "Does FTK index search support regular expression?" They just participated in FTK Bootcamp last month, and they're trying to spend more time with FTK now. The answer is "Yes". FTK index search supp

八月份课堂--Python爬虫(Spider)基础

一.爬虫(Spider) 请求网站,提取网页内容的最大化程序.获取到的是html代码,需要从这些文本中提取需要的数据. HTTP:是互联网上应用最为广泛的一种网络协议,是一个客户端和服务器端请求和应答的标准(TCP),用于从WWW服务器传输超文本到本地浏览器的传输协议,它可以使浏览器更加高效,使网络传输减少. HTTPS:是以安全为目标的HTTP通道,简单讲是HTTP的安全版,即HTTP下加入SSL层,HTTPS的安全基础是SSL,因此加密的详细内容就需要SSL. SSL(Secure Sock

oVirt专题:Hosted Engine之Engine Appliance使用(1)

前文中介绍了如何制作Engine Appliance.当Appliance制作好以后,如何使用它呢?下面就来详细介绍下Engine Appliance的使用方法. 首先,我们需要一台物理服务器,在这服务器上要先安装好CentOS7.0的操作系统.然后根据以下步骤进行配置: (1)配置网络 IP:192.168.14.67 NETMASK:255.255.252.0 GATEWAY:192.168.14.1 (2)配置域名解析 192.168.14.67      node.test 192.16

oVirt专题:Hosted Engine之Engine Appliance使用(2)

(5)执行命令,部署hosted-engine # hosted-engine --deploy [ INFO  ] Stage: Initializing           Continuing will configure this host for serving as hypervisor and create  a VM where you have to install oVirt Engine afterwards.           Are you sure you want