正则匹配所有的a标签

<a\b[^>]+\bhref="([^"]*)"[^>]*>([\s\S]*?)</a>分组1和分组2即为href和value

解释:<a\b                                        #匹配a标签的开始

[^>]+                                      #匹配a标签中href之前的内容

\bhref="([^"]*)"                       #匹配href的值,并将匹配内容捕获到分组1当中

[^>]*>                                    #匹配a标签中href之后的内容

([\s\S]*?)                                  #匹配a标签的value,并捕获到分组2当中,?表示懒惰匹配

</a>                                       #匹配a标签的结束
时间: 2024-10-18 18:47:01

正则匹配所有的a标签的相关文章

js 正则匹配(去掉html标签)

1,得到网页上的链接地址: string matchString = @"<a[^>]+href=\s*(?:'(?<href>^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>"; 2,得到网页的标题: string matchString = @"<title>(?<titl

如何用正则匹配这段文本

"<p style="text-align:center;">1 您不用压货,零库存,我们为您一件代发.2 本公司以批发为主,利润低薄,量大从优 .3 本厂鞋子自主生产,不打标不贴牌4 退换货7天退15天换,要求:(1)不影响二次销售.(2)不收过季产品5 气味.色差.配饰易掉.不明显处的胶渍.肉眼在1.5米以外不能明显分辨的划痕或不影响穿着的小瑕疵,不属于质量问题,鞋子都是才从工厂加工出来,部分鞋子肯定有轻微的味道,放在通风处一两天就消失了.每个人用的显示器不一

正则匹配抓取input 隐藏输入项和 &lt;td&gt;标签内的内容

这里不多作解释了,只要提供方法,如果想了解正则匹配,就去百度. 第一条是,匹配出所有的隐藏输入域 1 $patern = "/<input(.*?)type=\"hidden\"(.*?)name=\"(.*?)\"(.*?)value=\"(.*?)\"(.*?)>/im"; 2 if(preg_match_all($patern,$content,$hidden_match)){ 3 4 for($i=0;$i

正则匹配闭合HTML标签(支持嵌套)

任何复杂的正则表达式都是由简单的子表达式组成的,要想写出复杂的正则来,一方面需要有化繁为简的功底,另外一方面,我们需要从正则引擎的角度去思考问题.关于正则引擎的原理,推荐<Mastering Regular Expression>中文名叫<精通正则表达式>.挺不错的一本书. OK,先确定我们要解决的问题——从一段Html文本中找出特定id的标签的innerHTML. 这里面最大的难点就是,Html标签是支持嵌套的,怎么能够找到指定标签相对应的闭合标签呢? 我们可以这样想,先匹配最前

web爬虫,scrapy模块标签选择器下载图片,以及正则匹配标签

标签选择器对象 HtmlXPathSelector()创建标签选择器对象,参数接收response回调的html对象需要导入模块:from scrapy.selector import HtmlXPathSelector select()标签选择器方法,是HtmlXPathSelector里的一个方法,参数接收选择器规则,返回列表元素是一个标签对象 extract()获取到选择器过滤后的内容,返回列表元素是内容 选择器规则 //x 表示向下查找n层指定标签,如://div 表示查找所有div标签

正则匹配开关闭合标签

匹配任意闭合大括号: @"""JsonKey"":{((?<G>{)|}(?<-G>)|.*?)*}" 匹配任意闭合HTML标签的正则表达式: <(?<HtmlTag>[\w]+)[^>]*?>((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag>>(?<-Nested>)|.*?)

正则匹配酷6视频url后使用接口引用案例

通过酷6的一个转发接口,使用java正则来获取匹配酷6网大部分视频网址链接,抓取获得ip.flash.title等属性用于内嵌视频展示;关键代码是抓取数据,展示代码很简单.大致效果图如下: 引用视频: 展示视频: 1.抓取数据代码: <span style="font-family:KaiTi_GB2312;font-size:18px;"> /** * 酷6新接口方法 * add by yangkai * @param videoUrl * @return */ prot

PHP正则匹配与替换的简单例子

PHP正则匹配与替换的简单例子,含一个匹配获取加租字体例子和一个匹配替换超链接的例子. 1.查找匹配 <b> 与 </b> 标签的内容: <?php $str = "Name: <b>PHP</b> <br> Title: <b>Programming Language</b>"; preg_match_all ("/<b>(.*)<\/b>/U", $

正则匹配嵌套HTML

一,匹配单一的嵌套标签 <div>我是一层</div><div>   <div class="test">  我是二层div   <div class="test">我是三层div</div>   </div></div> 在Regex Tester中测试结果: <div[^>]*>[^<]*(((?'Open'<div[^>]*>