用php的正则表达式相关函数,实现提取html超链接<a href="地址"></a>中的地址
<?php
$preg=‘/<a .*?href="(.*?)".*?>/is‘;
$str =‘<a href="链接1">URLNAME</a>文本段1<a href="链接2" target="_blank">URLNAME</a>文本段2<a target="_blank" href="链接3">URLNAME</a>...文本段n‘;
preg_match_all($preg,$str,$match);//在$str中搜索匹配所有符合$preg加入$match中
for($i=0;$i<count($match[1]);$i++)//逐个输出超链接地址
{
echo $match[1][$i]."<br />";
}
?>
最终输出:
链接1<br />链接2<br />链接3<br />
附一个
PHP的正则表达式提取图片地址的代码。
$str=‘<p style="padding: 0px; margin-top: 0px; margin-bottom: 0px; line-height: 200%;"><img border="0" src="upfiles/2009/07/1246430143_4.jpg" /></p><p style="padding: 0px; margin-top: 0px; margin-bottom: 0px; line-height: 200%;"><img border="0" src="upfiles/2009/07/1246430143_3.jpg" /></p><p style="padding: 0px; margin-top: 0px; margin-bottom: 0px; line-height: 200%;"><img border="0" src="upfiles/2009/07/1246430143_1.jpg" /></p>‘;
$pattern="/<[img|IMG].*?src=[‘|"](.*?(?:[.gif|.jpg]))[‘|"].*?[/]?>/";
preg_match_all($pattern,$str,$match);
print_r($match);