正则表达式 (C++) (施工中)

先来看一个例子,要求写一段代码,实现如下功能:

从标准输入中读取一行字符串, 从中读取所有邮箱的格式;

对于这个问题,用传统的方式是可以解决的:

我们可以用解析字符串的方式实现,需要遍历一遍获取的字符串,读取其中关键的几个字符 “.” "@" ".com" 和其中的相关顺序;

C++11支持正则表达式,利用它可以避免重复造轮子;

代码:

#include <iostream>
#include <string>
#include <regex>

int main()
{
	std::string line;
	std::regex email(R"(\[email protected](\w+\.)+\w+)");
	while ( getline(std::cin, line) )
	{
		std::smatch matches;
		auto current = cbegin(line);
		auto last = cend(line);
		while ( current != last )
		{
			if (regex_search(current, last, matches, email))
			{
				std::ssub_match match = matches[0];
				current = match.second;
				std::cout << "[ " << match.str() << " ]" << std::endl;
			} 
			else
			{
				break;
			}
		}
	}
}

——————————————————————

正文:

一、正则表达式介绍

正则表达式(regular expression) 是一种描述字符序列的方法,是一种极其强大的计算工具。C++11中新增了这一特性,在 C++正则表达式库(RE库)中。

PS:RE库,定义在头文件 "regex"内,命名空间:std;

正则表达式组件:

regex        : 表示有一个正则表达式的类;

regex_match     : 将一个字符序列与一个正则表达式匹配;

regex_search     : 寻找第一个与正则表达式匹配的子序列;

regex_replace    : 使用给定格式替换一个正则表达式;

sregex_iterator    : 迭代器适配器,调用regex_search 来遍历一个string中所有匹配的子串;

smatch         : 容器类,保存在string中搜索的结果;

ssub_match      : string中匹配的子表达式的结果;

接下来简单介绍几个常用的组件:

regex类:

表示一个正则表达式。除了初始化和赋值操作,还支持其他的一些操作(后面介绍);

regex_match方法:

确定一个给定字符序列与一个给定regex对象是否完全匹配,返回true/false,如果匹配到,将匹配到的内容保存起来;

segex_search方法:

确定一个给定字符序列与一个给定regex对象是否匹配,只要有部分匹配,就返回true,如果匹配到,将匹配到的部分保存起来;

以上两个方法均有2个重载版本,分别为:

(seq, m, r, mft)
(seq, r, mft)
/*
seq:
待查找的字符串序列,
可以是一个std::string,或表示范围的一对迭代器,或一个指向空字符结尾的字符数组的指针

m:
match对象,用来保存匹配结果的相关细节

r:
regex对象,匹配的类型

mft:
(可选) regex_constants::match_flag_type类型,它们会影响匹配过程 (后述)
*/

二、使用RE库

(待续)

时间: 2024-11-10 10:36:37

正则表达式 (C++) (施工中)的相关文章

母函数入门笔记(施工中&hellip;

定义:对于一个数列,它的母函数(即生成函数)为   为了对这个准确求值,我们设    举一个简单的例子 例1 对于数列 他的生成函数为 ,那么应用一下等比数列求和公式 这里由于 所以当时 那么   例2 对于数列 生成函数 就是上面那个的比例系数放大到b 那么就是 例3 对于数列 生成函数 就是比例系数放大到 可以得出 类比可以得到   例4 然后是一个很鬼的 对于数列求生成函数 我们考虑这个东西是在无限定义下的 所以等价于 例5 然后是一个稍微麻烦点的 对于数列求生成函数   然后为了把这个东

The C Programming Language(K&R) 扣细节随记(施工中...

各种糟糕,入坑这么久才开始看K&R的The C Programming Language学C,而且还是为了应付开学某场滚回本体的考试(虽然觉着即使复习了还会被各种吊打),废话不多说,开始施工.? ? |--> 导言 整数除法会执行舍位,故要先乘后除. 数据类型: 关键字 位长(字节) 范围 格式化字符串 char 1 bytes -128..127(或0..255,与体系结构相关) ?%c unsigned char 1bytes 0..255 ?%c,?%hhu signed char 1

Java使用正则表达式取网页中的一段内容(以取Js方法为例)

关于正则表达式: 表1.常用的元字符 代码 说明 . 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 \b 匹配单词的开始或结束 ^ 匹配字符串的开始 $ 匹配字符串的结束 表2.常用的限定符 代码/语法 说明 * 重复零次或更多次 + 重复一次或更多次 ? 重复零次或一次 {n} 重复n次 {n,} 重复n次或更多次 {n,m} 重复n到m次 表3.常用的反义代码 代码/语法 说明 \W 匹配任意不是字母,数字,下划线,汉字的字符 \S

正则表达式(/[^0-9]/g,&#39;&#39;)中的&quot;/g&quot;是什么意思?

解答“正则表达式(/[^0-9]/g,'')中的"/g"是什么意思?”这个问题,也为了能够便于大家对正则表达式有一个更为综合和深刻的认识,我将一些关键点和容易犯糊涂的地方再系统总结一下. 总结1:附件参数g的用法 表达式加上参数g之后,表明可以进行全局匹配,注意这里“可以”的含义.我们详细叙述: 1)对于表达式对象的exec方法,不加入g,则只返回第一个匹配,无论执行多少次均是如此,如果加入g,则第一次执行也返回第一个匹配,再执行返回第二个匹配,依次类推.例如 var regx=/us

用C#通过正则表达式截取字符串中符合条件的子字符串

仅仅作为简单的记录,不多说直接上代码(仅测试使用): private void Test() { Regex ConnoteA = new Regex("^[a-zA-Z]\\d{8}$"); Regex ConnoteAA = new Regex("^[a-zA-Z]{2}\\d{7,10}$"); Regex ConnoteAAA = new Regex("^[a-zA-Z]{3}\\d{5,9}$"); Regex ConnoteAAAA

使用正则表达式寻找字符串中出现了几个[***]样式的字符串

使用正则表达式寻找字符串中出现了几个[***]样式的字符串 源码如下: - (NSUInteger)analyseRX:(NSString *)string withPatternString:(NSString *)patternString { // \\[[^\\]]+\\] 用以匹配字符串中所出现的 [*] 的个数 // <[^>]+> 用以匹配字符串中所出现的 <*> 的个数 if (string == nil) { return 0; } // 正则表达式 NSR

C# 使用正则表达式去掉字符串中的数字

C# 使用正则表达式去掉字符串中的数字 // 去掉字符串中的数字public static string RemoveNumber(string key){    return System.Text.RegularExpressions.Regex.Replace(key, @"\d", "");} // 去掉字符串中的非数字public static string RemoveNotNumber(string key){    return System.Tex

正则表达式(/[^0-9]/g,&#39;&#39;)中的&quot;/g&quot;是什么意思 ?

正则表达式(/[^0-9]/g,'')中的"/g"是什么意思 ?     表达式加上参数g之后,表明可以进行全局匹配,注意这里“可以”的含义.我们详细叙述: 1)对于表达式对象的exec方法,不加入g,则只返回第一个匹配,无论执行多少次均是如此,如果加入g,则第一次执行也返回第一个匹配,再执行返回第二个匹配,依次类推.例如 var regx=/user\d/; var str=“user18dsdfuser2dsfsd”; var rs=regx.exec(str);//此时rs的值为

正则表达式在JS中的使用

<script type="text/javascript"> /** *正则表达式在js中的第一种使用方式: * RegExp 通过构造器去使用正则表达式 需要对反斜杠进行转义 不能将\\替换为/ * i模式 表示不区分大小写 * g模式 表示全局模式 进行全局匹配 * 非g模式 表示每次查找的时候 都重头开始查找 */ var reg = new RegExp("[abcd]","gi"); /** * 正则表达式在js中的第二种