php用正则表达式获取网站的标题内容

  1. 已知网站的网址,用php获取网站的内容。
  2. 编写正则表达式。
  3. 用preg_match_all函数获取标题内容。
1         $url=‘http://www.m-ivi.com‘;
2         $content=file_get_contents($url);
3         $match=‘/<title>.*<\/title>/i‘;
4         $ru=preg_match_all($match,$content,$ma);       //获取
5         $title=$ma[0][0];        

以上是以www.m-ivi.com为例子,返回值是“<title>深圳网站设计|网站建设|深圳网页设计|高端网站设计|深圳网站建设【艾维艾科技】</title>”。

可自行更换自己想要的网址。

时间: 2024-11-09 17:09:42

php用正则表达式获取网站的标题内容的相关文章

Android中WebView获取网页中标题 ,内容, 图片的方法

如题,在Android中WebView获取网页中标题 ,内容, 图片的方法 首先是获取标题,在new WebChromeClient(){}中重写onReceivedTitle()方法 @Override public void onReceivedTitle(WebView view, String title) { super.onReceivedTitle(view, title); // loge.e("__页面标题__"+title); } 获取内容,是参考的这边的 http

正则表达式 获取括号内的内容

https://blog.csdn.net/genius_yym/article/details/79670035 JS 正则表达式 获取小括号 中括号 花括号内的内容 var str="123{xxxx}456[我的]789123[你的]456(1389090)789"; var regex1 = /\((.+?)\)/g; // () 小括号 var regex2 = /\[(.+?)\]/g; // [] 中括号 var regex3 = /\{(.+?)\}/g; // {}

iPhone开发--正则表达式获取字符串中的内容

缘起: 想获取字符串中指定的字符,考虑用正则表达式,遂写了如下的代码: [cpp] view plaincopy NSString *htmlStr = @"oauth_token=1a1de4ed4fca40599c5e5cfe0f4fba97&oauth_token_secret=3118a84ad910967990ba50f5649632fa&name=foolshit"; NSString *regexString = @"oauth_token=(\

正则表达式获取TABLE里的内容

//过滤\n 转换成空            String withoutNString=message.Replace("\n", "");            //过滤\r 转换成空            String withoutRString = withoutNString.Replace("\r", "");            //过滤\t 转换成空            String withoutTSt

分析html格式数据,根据正则表达式获取所需数据,并存入数据库

例子为获取<dl>中的<dt></dt><dd></dd>中的内容,由于在<dt></dt>标签中还存在<a>标签,所有会一同举例说明.第一次做不够优化,共同学习. <!DOCTYPE html> <html> <head> <title><title> </head> <body> <dl class="hel

从网页中通过正则表达式获取标题等信息(二)实现过程分析

上篇文章,介绍了我2012年实现的一个内容聚合网站,通过正则表达式抽取网页内容,并提供了代码实现. 从网页中通过正则表达式获取标题.URL和发表时间 本文将进一步介绍其实现过程: (1)网页结构分析 在2012年左右,JavaScript还远没有今天这么强大,当时html是网页的骨架,css进行风格装饰,javascript提供动作. [注]在当今动辄 React.Angular.Vue之类技术做前端,前端一栈式开发的背景下,内容抽取也许大不一样. 从网页页面上抽取内容,需要分析其html结构.

正则表达式获取body内容

最近项目需要,要弄个正则表达式获取body的内容. 用过angularjs就知道,很多时候要写指令时引用templateUrl的时候.template的内容root是不能包含多个节点的,否则就报错. 这样的规范很不好,很多时候还是想保留template的头,文档类型,css等信息. 所以在开发模式下,希望angularjs加载模板的时候,自动砍掉头部和尾部. 获取之前: <!DOCTYPE html> <html> <head lang="en">

C#正则表达式获取组名,按照组名输出匹配内容

最近写了个正则表达式匹配的工具,可以按照组名输出匹配内容,还是挺方便的,代码留存一下,以后用的话,直接copy了. Regex regex = new Regex(this.textBoxRegex.Text); Match result = regex.Match(this.textBoxText.Text); if (result.Success) { StringBuilder sb = new StringBuilder(); foreach (var groupName in rege

【实例】正则表达式利用grep和sed处理日志内容,获取所需的内容

[实例]正则表达式利用grep和sed处理日志内容, 获取所需的内容 app.log文件内容: 2014-09-11 00:00:01,516 INFO [com.tt.bb.thread.Control] - Socket连接:/182.105.83.33:532172014-09-12 10:00:06,555 INFO [com.tt.bb.thread.Control] - Socket连接:/182.113.83.51:53249 2014-09-13 20:00:11,587 INF