正则递归匹配

        /// <summary>
        /// 正则递归匹配
        /// </summary>
        /// <param name="dicVal">返回一个字典</param>
        /// <param name="context">要匹配的字符串</param>
        /// <param name="i">从第几个正则表达式开始匹配</param>
        /// <param name="regexes">正则表达式</param>
        private static void RegexStr(ref Dictionary<string, string> dicVal, string context, int i, string[] regexes)
        {
            if (i <= (regexes.Length - 1))
            {
                Regex regex = new Regex(ReplaceStr(regexes[i]));
                MatchCollection mc = regex.Matches(context);
                foreach (Match m in mc)
                {
                    foreach (string name in regex.GetGroupNames())//寻找被标记的组
                        if (name.StartsWith("val"))
                            dicVal.Add(name, m.Groups[name].Value);
                    RegexStr(ref dicVal, m.Value, i + 1, regexes);
                }
            }
        }

调用示例

string htmlData = "html";
string[] regexes = {
                               @".+?",
                               @".+?",
                               @".+?"
                               };
Dictionary<string, string> dicValOut = new Dictionary<string, string>();
            RegexStr(ref dicValOut, htmlData, 0, regexes);
时间: 2024-10-07 12:47:59

正则递归匹配的相关文章

正则引擎入门&mdash;&mdash;正则文法匹配可以简单快捷(三)

整篇文章是对作者Russ Cox的文章Regular Expression Matching Can Be Simple And Fast的翻译,在我看来,该文章是入门正则引擎的较好的文章之一,读者在阅读之前,最好有一定的正则表达式的基础.翻译内容仅代表作者观点.侵删 该作者所有的文章的网址在此:https://swtch.com/~rsc/regexp/ 正文 正则表达式搜索算法 现在我们已经有了确定一个正则表达式是否匹配一个字符串的方法,将正则表达式转换为NFA之后以字符串为输入运行该NFA

正则表达式话题 【正则表达式--递归匹配与非贪婪匹配 】

[出处:http://www.regexlab.com/zh/regtopic.htm] 引言 本文将逐步讨论一些正则表达式的使用话题.本文为本站基础篇之后的扩展,在阅读本文之前,建议先阅读正则表达式参考文档一文. 1. 表达式的递归匹配 有时候,我们需要用正则表达式来分析一个计算式中的括号配对情况.比如,使用表达式 "\( [^)]* \)" 或者 "\( .*? \)" 可以匹配一对小括号.但是如果括号 内还嵌有一层括号的话 ,如 "( ( ) )&q

正则表达式 零宽断言 负向零宽断言 平衡组/递归匹配

零宽断言 用于查找在某些内容(但并不包括这些内容)之前或之后的东西,像\b,^,$那样用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言. (?<=exp)myexp(?=exp1) 负向零宽断言 与零宽断言类似 (?<!exp)myexp(?!exp1) 自己用上面的例子测试下 (?<=<(\w+)>).*(?=<\/\1>) 平衡组/递归匹配 这个看起来有点复杂,其实就是 push/pop. 这里很像编程语言,或者说像个语法分析器

javascript正则——贪婪匹配

熟悉正则的朋友都知道,正则的匹配有"贪婪"和"非贪婪"之分. "贪婪"匹配是尽可能多的匹配: 对于字符串'aaaa', /a+/匹配整个字符串,而非贪婪匹配/a+?/匹配的是整个字符串的第一个'a',因为贪婪匹配是尽可能少的匹配. -------------- 使用非贪婪匹配还有一些需要注意的地方. 考虑下面这个正则表达式:/a+b/,它匹配一个或多个a,以及一个b. 使用'aaab'作为匹配字符串时,它会匹配整个字符串. 如果我们换成/a+?b

python 中文正则表达匹配

需求:由于某个n年前的工具的错误,在复制一批文件的时候产生了大量的"复件xxxxxxx""复件(2)XXXXX"等类似文件,由于目录结构深,文件多,预计在5000万个,但是有多少这种错误的文件不清楚,因此写个脚本遍历删除. #encoding=utf-8 #author: skybug #date: 2014-05-11 #function: 遍历指目录,删除中文开头的文件名的图片 import os,re cnt = 0 pattern = re.compile(

C#正则表达式的递归匹配分析

在C#程序设计中经常会遇到这样的需求,要求匹配出成对的小括号里的内容,但是一般正则表达式中的 ?R 的语法似乎在C#中不被支持, 经过一番查找与测试,终于找到以下一段描述 /(  应该是 \( 不是用 /转义而是用 \来转义 匹配嵌套的构造 微软公司已经包含了一个有趣的创新来匹配稳定的构造(历史上,这是正则表达式所做不到的).这并不容易掌握 ― 尽管这节较短,但是注意,它非常的晦涩难懂. 从一个例子开始可能更简单一些,所以我用这段代码作为开始: Regex r = new Regex(@"/((

42 python中正则中的分组 正则中匹配字符串的起始和结尾以及单词边界

第七课 正则中的分组 # 分组 # 正则表达式中用一对圆括号括起来的部分被称为一个分组 # '(\d\d\d)-(\d\d)' import re ''' 1. 只有圆括号括起来的部分才算一组,如果正则表达式中既有被圆括号括起来的部分, 也有未被圆括号括起来的部分,那么只将圆括号括起来的部分算一组 2. group方法,如果不指定参数,会返回匹配的整个字符串,如果加参数,会返回指定 分组的字符串,组索引从1开始 3. groups方法,以元组形式返回匹配的所有分组 4. 分组的索引是从1开始的

41 正则中匹配多个字符串匹配任意单个字符正则中使用字符串重复、可选和特殊字符

第三课 正则中匹配多个字符串 # 匹配多个字符串 # 择一匹配符号, | import re s = 'Python|Ruby|Java|Swift' m = re.match(s,'PythonRuby') print(m) # <re.Match object; span=(0, 6), match='Python'> m = re.search(s, 'I love Python.') print(m) # <re.Match object; span=(7, 13), match

正则常用匹配符号

常用正则匹配符号 所有的正则匹配符号都在java.util.regex.Pattern类之中定义. 1.字符:匹配单个字符 a :匹配字母a \\ :匹配"\" \t :匹配转义字符"\t" \n :匹配转义字符"\n" 2.一组字符:任意匹配里面的一个单个字符 [abc] :表示可能是字母a,字母b,或者字母c [^abc] :不是字母a,b,c中的任意一个 [a-zA-Z] :表示全部字母中的任意一个 [0-9] :全部数字的任意一个 3.边