正则递归匹配

        /// <summary>
        /// 正则递归匹配
        /// </summary>
        /// <param name="dicVal">返回一个字典</param>
        /// <param name="context">要匹配的字符串</param>
        /// <param name="i">从第几个正则表达式开始匹配</param>
        /// <param name="regexes">正则表达式</param>
        private static void RegexStr(ref Dictionary<string, string> dicVal, string context, int i, string[] regexes)
        {
            if (i <= (regexes.Length - 1))
            {
                Regex regex = new Regex(ReplaceStr(regexes[i]));
                MatchCollection mc = regex.Matches(context);
                foreach (Match m in mc)
                {
                    foreach (string name in regex.GetGroupNames())//寻找被标记的组
                        if (name.StartsWith("val"))
                            dicVal.Add(name, m.Groups[name].Value);
                    RegexStr(ref dicVal, m.Value, i + 1, regexes);
                }
            }
        }

调用示例

string htmlData = "html";
string[] regexes = {
                               @".+?",
                               @".+?",
                               @".+?"
                               };
Dictionary<string, string> dicValOut = new Dictionary<string, string>();
            RegexStr(ref dicValOut, htmlData, 0, regexes);

时间： 2024-10-07 12:47:59

正则递归匹配的相关文章

正则引擎入门——正则文法匹配可以简单快捷(三)

整篇文章是对作者Russ Cox的文章Regular Expression Matching Can Be Simple And Fast的翻译,在我看来,该文章是入门正则引擎的较好的文章之一,读者在阅读之前,最好有一定的正则表达式的基础.翻译内容仅代表作者观点.侵删该作者所有的文章的网址在此:https://swtch.com/~rsc/regexp/ 正文正则表达式搜索算法现在我们已经有了确定一个正则表达式是否匹配一个字符串的方法,将正则表达式转换为NFA之后以字符串为输入运行该NFA

正则表达式话题【正则表达式--递归匹配与非贪婪匹配】

[出处:http://www.regexlab.com/zh/regtopic.htm] 引言本文将逐步讨论一些正则表达式的使用话题.本文为本站基础篇之后的扩展,在阅读本文之前,建议先阅读正则表达式参考文档一文. 1. 表达式的递归匹配有时候,我们需要用正则表达式来分析一个计算式中的括号配对情况.比如,使用表达式 "$ [^)]* $" 或者 "$ .*? $" 可以匹配一对小括号.但是如果括号内还嵌有一层括号的话 ,如 "( ( ) )&q

正则表达式零宽断言负向零宽断言平衡组/递归匹配

零宽断言用于查找在某些内容(但并不包括这些内容)之前或之后的东西,像\b,^,$那样用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言. (?<=exp)myexp(?=exp1) 负向零宽断言与零宽断言类似 (?<!exp)myexp(?!exp1) 自己用上面的例子测试下 (?<=<(\w+)>).*(?=<\/\1>) 平衡组/递归匹配这个看起来有点复杂,其实就是 push/pop. 这里很像编程语言,或者说像个语法分析器

javascript正则——贪婪匹配

熟悉正则的朋友都知道,正则的匹配有"贪婪"和"非贪婪"之分. "贪婪"匹配是尽可能多的匹配: 对于字符串'aaaa', /a+/匹配整个字符串,而非贪婪匹配/a+?/匹配的是整个字符串的第一个'a',因为贪婪匹配是尽可能少的匹配. -------------- 使用非贪婪匹配还有一些需要注意的地方. 考虑下面这个正则表达式:/a+b/,它匹配一个或多个a,以及一个b. 使用'aaab'作为匹配字符串时,它会匹配整个字符串. 如果我们换成/a+?b

python 中文正则表达匹配

需求:由于某个n年前的工具的错误,在复制一批文件的时候产生了大量的"复件xxxxxxx""复件(2)XXXXX"等类似文件,由于目录结构深,文件多,预计在5000万个,但是有多少这种错误的文件不清楚,因此写个脚本遍历删除. #encoding=utf-8 #author: skybug #date: 2014-05-11 #function: 遍历指目录,删除中文开头的文件名的图片 import os,re cnt = 0 pattern = re.compile(

C#正则表达式的递归匹配分析

在C#程序设计中经常会遇到这样的需求,要求匹配出成对的小括号里的内容,但是一般正则表达式中的 ?R 的语法似乎在C#中不被支持, 经过一番查找与测试,终于找到以下一段描述 /( 应该是 \( 不是用 /转义而是用 \来转义匹配嵌套的构造微软公司已经包含了一个有趣的创新来匹配稳定的构造(历史上,这是正则表达式所做不到的).这并不容易掌握 ― 尽管这节较短,但是注意,它非常的晦涩难懂. 从一个例子开始可能更简单一些,所以我用这段代码作为开始: Regex r = new Regex(@"/((

42 python中正则中的分组正则中匹配字符串的起始和结尾以及单词边界

第七课正则中的分组 # 分组 # 正则表达式中用一对圆括号括起来的部分被称为一个分组 # '(\d\d\d)-(\d\d)' import re ''' 1. 只有圆括号括起来的部分才算一组,如果正则表达式中既有被圆括号括起来的部分, 也有未被圆括号括起来的部分,那么只将圆括号括起来的部分算一组 2. group方法,如果不指定参数,会返回匹配的整个字符串,如果加参数,会返回指定分组的字符串,组索引从1开始 3. groups方法,以元组形式返回匹配的所有分组 4. 分组的索引是从1开始的

41 正则中匹配多个字符串匹配任意单个字符正则中使用字符串重复、可选和特殊字符

第三课正则中匹配多个字符串 # 匹配多个字符串 # 择一匹配符号, | import re s = 'Python|Ruby|Java|Swift' m = re.match(s,'PythonRuby') print(m) # <re.Match object; span=(0, 6), match='Python'> m = re.search(s, 'I love Python.') print(m) # <re.Match object; span=(7, 13), match

正则常用匹配符号

常用正则匹配符号所有的正则匹配符号都在java.util.regex.Pattern类之中定义. 1.字符:匹配单个字符 a :匹配字母a \\ :匹配"\" \t :匹配转义字符"\t" \n :匹配转义字符"\n" 2.一组字符:任意匹配里面的一个单个字符 [abc] :表示可能是字母a,字母b,或者字母c [^abc] :不是字母a,b,c中的任意一个 [a-zA-Z] :表示全部字母中的任意一个 [0-9] :全部数字的任意一个 3.边