在分析网址中的图片的地址时,会用到如下正则表达式:
src="(.+?\.jpg)"
其中".+?"一直不太明白,"."符号匹配任意字符,"+"匹配1或多次,后面再跟问号却不明白什么意思,后台再去看正则表达式,才发现是懒惰模式,及匹配最少次数。
例如:
要匹配文本
<img class="BDE_Image" src="http://imgsrc.baidu.com/forum/w%3D580/sign=5c0f6d1da10f4bfb8cd09e5c334e788f/1ea48c1001e93901ff328fbc7eec54e737d196f9.jpg" pic_ext="jpeg" height="640" width="480">
匹配结果:
src="http://imgsrc.baidu.com/forum/w%3D580/sign=5c0f6d1da10f4bfb8cd09e5c334e788f/1ea48c1001e93901ff328fbc7eec54e737d196f9.jpg"
其中,匹配公式里,+改为*也是可以的。
时间: 2024-10-13 05:02:32