php匹配页面中的所有路径

方法一

$url=‘http://www.google.cn/search?q=php‘;
$html=file_get_contents($url);

$dom = new DOMDocument();
@$dom->loadHTML($html);

$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//a");

for ($i = 0; $i < $hrefs->length; $i++) {
    $href = $hrefs->item($i);
    $url = $href->getAttribute(‘href‘);
    echo $url.‘<br />‘;
}
$url=‘http://www.google.cn/search?q=php‘;

$str=file_get_contents($url);
$preg=‘/<a .*?href="(.*?)".*?>/is‘;
preg_match_all($preg,$str,$array2);
for($i=0;$i<count($array2[1]);$i++)//逐个输出超链接地址
{
    echo $array2[1][$i]."<br />";
}

原文地址:https://www.cnblogs.com/huay/p/10370641.html

时间: 2024-08-30 13:24:49

php匹配页面中的所有路径的相关文章

LA 3126 二分匹配---DAG中的最小路径应用

题意:有 n 个顾客 , 需要坐出租车从一个地方去另一个地方 , 每个顾客的出发时间.出发地点.目的地点都已给出 , 从出发地点到目的地点的时间为两地之间的路径长度 , 并且出租车要比顾客的出发时间早一分钟到达 , 问最少需要派出多少辆出租车. 解法:我们先这样来构图 , 每个顾客是一个结点,如果同一个出租车在接完客人 u 之后还来得及节客人 v , 那么就在 u 到 v 之间连一条有向边 . 由此可以发现 , 这个图是一个DAG , 那么我们就只需要找最小路径覆盖(最小路径覆盖:是指在图中找尽

C#正则表达式匹配HTML中的图片路径

最近的项目中有个关于网页取图的功能需要我自己开发,那就是用正则表达式来匹配图片标签. 一般来说一个 HTML 文档有很多标签,比如“<html>”.“<body>”.“<table>”等,想把文档中的 img 标签提取出来并不是一件容易的事.由于 img 标签样式变化多端,使提取的时候用程序寻找并不容易.于是想要寻找它们就必须写一个非常健全的正则表达式,不然有可能会找得不全,或者找出来的不是正确的 img 标签. 我们可以从 HTML 标签的格式去想应该怎么建这个正则表

根据正则表达式匹配页面中js和css文件

// 匹配 List<string> srcList = new List<string>(); List<string> linkList = new List<string>(); // 匹配js文件 string pattern = "<script[^>]*?src=\"([^>]*?)\"[^>]*?>"; MatchCollection mcs = Regex.Matches(

关于 ng-include 在一个页面中加载另一个页面的路径问题

程序的结构图 index.html <!DOCTYPE html> <html ng-app="bookStoreApp"> <head lang="en"> <meta charset="UTF-8"> <title>BookStore</title> <script src="framework/angular.js"></scrip

servlet中的相对路径和绝对路径

servlet中,所有路径的配置都要用绝对路径. 什么是绝对路径,就是以“/”开头的路径(开发中就这样理解). 实际开发中,“/”所代表的含义不同,但主要分以下两种情况: 1.servlet内部配置路径 servlet内部的含义就是:在客户端看不到,全是在(应用)后台处理的部分(简单说,就是除了JSP以外的所有地方).包含以下2点: a. web.xml中servlet 配置的路径 <servlet>  <servlet-name>helloWorld</servlet-na

config.js配置页面中的样式和图片路径

这个文章用在什么地方,我先说一下,上周啊,我接到一个任务.因为公司业务要对接不同的银行,例如在工行下颜色是红色的,在其他银行下默认为蓝色,所以在页面一致的情况下,保证页面中的按钮和ICON是可以配置的,这样秩序改动一个值[颜色或路径],就能正常全部适配好了,其实这个业务很简单: **第一种方案:我们有新建两个config1.js和config2.js,代码分别类似如下:** var config = { // 改变全局按钮颜色 btncolor: "red", // 配置优惠券和同意的

Jsp页面中动态的引入另一个jsp,jsp:include路径是变量的实现

1 问题描述 在页面搭建时,会有这样的需求,希望局部页面动态的引用另一个jsp.这里的"动态"的意思引用的jsp的路径是个变量.举个例子,我们希望局部页面可能是page1.jsp或者是page2.jsp. 2 解决方案 2.1 解决方案描述 我使用的是jsp动态导入的技术实现的.动态导入的代码如下.本文的重点是讨论文件的url,能不能是个变量?<jsp:include page="文件的url" flush="true"/> 答案是可

PHP获取指定URL页面中的所有链接

form:http://www.uphtm.com/php/253.html 这个东西其实我们开发人员来讲常用了,以前做一个抓取其它网站友情连接时用过,今天看到一朋友整理了一个PHP获取指定URL页面中的所有链接函数,整理过来我们一起来看看吧. 以下代码可以获取到指定URL页面中的所有链接,即所有a标签的href属性: // 获取链接的HTML代码 $html = file_get_contents('http://www.111cn.net'); $dom = new DOMDocument(

使用PHP的正则抓取页面中的网址

最近有一个任务,从页面中抓取页面中所有的链接,当然使用PHP正则表达式是最方便的办法.要写出正则表达式,就要先总结出模式,那么页面中的链接会有几种形式呢? 链接也就是超级链接,是从一个元素(文字.图片.视频等)链接到另一个元素(文字.图片.视频等).网页中的链接一般有三种,一种是绝对URL超链接,也就是一个页面的完整路径:另一种是相对URL超链接,一般都链接到同一网站的其他页面:还有一种是页面内的超链接,这种一般链接到同一页面内的其他位置. 搞清楚了链接的种类,就知道要抓链接,主要还是绝对URL