php正则匹配html中的带class的div,选取其中的内容

<div class="chartInfo">

                <div class="line"></div>

                <div class="tideTable">
                    <strong>潮汐表</strong><span style="font-size:12px;font-weight:lighter;margin-left:-20px;">数据仅供参考</span>
                    <table width="500" border="0" cellspacing="0" cellpadding="0">
                      <tbody><tr>
                        <td width="100"><p><span>潮时 (Hrs)</span></p></td>
                                                <td width="100"><p>00:58</p></td>
                                                <td width="100"><p>05:20</p></td>
                                                <td width="100"><p>13:28</p></td>
                                                <td width="100"><p>21:15</p></td>
                                              </tr>
                      <tr>
                        <td><p><span>潮高 (cm)</span></p></td>
                                                <td width="100"><p>161</p></td>
                                                <td width="100"><p>75</p></td>
                                                <td width="100"><p>288</p></td>
                                                <td width="100"><p>127</p></td>
                                              </tr>
                    </tbody></table>
					                    <h2>时区:-1000 (东10区)  潮高基准面:在平均海平面下174CM</h2>
					                </div>
                <div class="chart">
					<!--<img src="http://www.cnss.com.cn/statics/images/cnss/tide/tide.jpg" width="600" height="350" title="" alt="" /> -->

                </div>

            </div>
这是源程序里边的一部分,为了容易看懂,删减了一大部分,只取<span style="font-family: Arial, Helvetica, sans-serif;"><div class="tideTable"> div块中的内容</span>
<span style="font-family: Arial, Helvetica, sans-serif;">首页先用file_get_content或curl获取内容部分,我用的是curl。</span>
<span style="font-family: Arial, Helvetica, sans-serif;"><span style="white-space:pre"></span><span style="white-space:pre">		</span>$ch = curl_init();
<span style="white-space:pre">		</span>curl_setopt($ch, CURLOPT_URL, $url);
<span style="white-space:pre">		</span>curl_setopt($ch, CURLOPT_POST, 1);
<span style="white-space:pre">		</span>curl_setopt( $ch, CURLOPT_HEADER, 0 );
<span style="white-space:pre">		</span>curl_setopt( $ch, CURLOPT_RETURNTRANSFER, 1 );
<span style="white-space:pre">		</span>curl_setopt( $ch, CURLOPT_POSTFIELDS, $data );
<span style="white-space:pre">		</span>$return = curl_exec( $ch );
<span style="white-space:pre">		</span>curl_close( $ch );
<span style="white-space:pre">		</span>
<span style="white-space:pre">		</span>$regex4="/<div class=\"tideTable\".*?>.*?<\/div>/ism";
<span style="white-space:pre">		</span>if(preg_match_all($regex4, $return, $matches)){
            <span style="white-space:pre">		</span> print_r($matches);
<span style="white-space:pre">		</span>}else{
<span style="white-space:pre">			</span>echo '0';
<span style="white-space:pre">		</span>}</span>
<span style="font-family:Arial, Helvetica, sans-serif;">这样就可以了,不多解释,懂PHP的看代码,打印看一下效果。</span>
</pre><pre name="code" class="html">
</pre><pre name="code" class="html">
时间: 2024-09-30 18:32:53

php正则匹配html中的带class的div,选取其中的内容的相关文章

Java实现正则匹配HTML中获取的图片链接

package demo; import java.io.File; import java.text.Collator; import java.util.ArrayList; import java.util.Arrays; import java.util.Comparator; import java.util.List; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Demo {

正则匹配括号中内容

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Document</title> </head> <body> <script> var reg = /\((.+?)\)/g; var reg2 = /\((.+?)\)/; var str = 'scale(1.5)

php正则匹配video 中或者img的宽度和高度。

preg_match('/\bwidth="(\d+)"/',$contentimages, $vwith);//宽 preg_match('/\bheight="(\d+)"/',$contentimages, $vheight);//高 原文地址:https://www.cnblogs.com/xiager/p/8252819.html

iOS 中的正则匹配(工具类)

正则表达式 正则表达式是对字符串操作的一种逻辑公式, 用事先定义好的一些特定字符.及这些特定字符的组合, 组成一个"规则字符串", 这个"规则字符串"用来表达对字符串的一种过滤逻辑, 正则表达式就是用于描述这些规则的工具, 或者说, 正则表达式就是记录文本规则的代码. 在开发中, 我们经常会有查找符合某些复杂规则的字符串的需要, 比如数据校验: 判断用户的输入是否合法(如:用户注册的时候,QQ号码,电话号码,邮箱是否符合要求) 下面让我们先来看看正则匹配常用的一些字

利用Python正则匹配中文——爬取校园网公告栏中感兴趣的内容

写这个程序是因为校园网公告栏时不时会有学术报告,讲座之类的信息发布,但这类信息往往发布在讲座的前一天,以至于丢失很多重要消息.同时公告栏里也会发布一些跟学生无关的内容,比如工会主席会议啥的. 主要遇到的困难时对中文的正则匹配问题.(比如通过第一次正则可以提取到一个页面内的所有中文标题,第二次正则从这些中文标题中将能匹配上“报告”两个字的对象添加到结果list内) 学校公告页面是gb2312编码.我使用的方式是,整个工程使用utf-8编码,将需要匹配的关键字转换成utf-8编码格式,使用正则匹配u

正则匹配中 ^ $ 和 \b 的区别

正则匹配中 ^ $ 和 \b 的区别 ^和$分别代表字符串的开始和结束,因此^\d$只能匹配包含一个数字的字符串\b代表单词边界,其前后必须是不同类型的字符,可以组成单词的字符为一种类型,不可组成单词的字符(包括字符串的开始和结束)为另一种类型因此\b\d\b可以匹配"%3%"中的3,但不能匹配"23"中的任意一个数字

PHP中preg_match正则匹配的/u /i /s是什么意思

PHP中preg_match正则匹配的/u /i  /s是什么意思  /u 表示按unicode(utf-8)匹配(主要针对多字节比如汉字) /i 表示不区分大小写(如果表达式里面有 a, 那么 A 也是匹配对象) /s 表示将字符串视为单行来匹配

关于php中正则匹配包括换行符在内的任意字符的问题总结

要使用正则匹配任意字符的话,通常有以下几种方法,这里我分别对每一种方法在使用的过程中做一个总结: 第一种方式:[.\n]*? 示例 ? PHP preg_match_all('/<div class="list">[.\n]*?<\/div>/i', $content, $data); 按道理这种方式应该是可以的,但我测试发现不行,因为这里中括号里面的“.”被当作一个普通的英文句号去处理了,而不是通配符,因此这里只能匹配到包含英语句号及换行符在内的任意内容了.

Python正则匹配字母大小写不敏感在读xml中的应用

需要解决的问题:要匹配字符串,字符串中字母的大小写不确定,如何匹配? 问题出现之前是使用字符串比较的方式,比如要匹配'abc',则用语句: 1 if s == 'abc':#s为需要匹配的字符串 2 print '匹配成功\n' 现在的问题是s可能是Abc.ABC等等,所以需要大小写不敏感的匹配,如果把需要匹配的模式的大小写进行罗列,那即使是三个字母的短模式也是很麻烦,查了一下,正则表达式re模块中有个参数flags=re.I,这样就可以大小写不敏感的匹配了,示例如下: 1 import re