php正则匹配类

  • 代码:
    /**
    * @desc:正则匹配类
    * @author [Lee] <[<[email protected]>]>
    * @method
    * 1、geturl         获取所有超链接
    * 2、getimg         获取所有图片
    * 3、getaudio           获取所有音频文件
    * 4、getvideo           获取所有视频文件
    * 5、getparagraph       获取所有段落
    * 6、getuser            获取自定义内容         preg 自定义正则,如:/<h1>(.*)<h1>/Ui
    */
    class match{
    private $content = ‘‘;
    /*
     @desc:构造方法,初始化待匹配文本
     */
    public function __construct($content){
        $this->content = $content;
    }
    /*
     @desc:获取所有超链接
     @return:所有匹配的超链接
     */
    public function geturl(){
        $content = $this->content;
        $preg = ‘/<[a|A].*?href=[\‘\"]{0,1}([^>\‘\"\ ]*).*?>/i‘;
        $bool = preg_match_all($preg,$content,$res);
        $urls = array();
        if($bool){
            $urls = $res[1];
        }
        return array_unique($urls);
    }
    /*
     @desc:获取所有图片
     @return:所有匹配的图片
     */
    public function getimg(){
        $content = $this->content;
        $preg="/(src)=(\\\?)([\"|‘]?)([^ \"‘>]+\.(gif|jpg|jpeg|bmp|png|svg))\\2\\3/i";
        $bool = preg_match_all($preg,$content,$res);
        $imgs = array();
        if($bool){
            $imgs = $res[4];
        }
        return array_unique($imgs);
    }
    /*
     @desc:获取所有音频文件
     @return:所有匹配的音频文件
     */
    public function getaudio(){
        $content = $this->content;
        $preg="/(src)=(\\\?)([\"|‘]?)([^ \"‘>]+\.(mp3|wav|wma|ogg|ape|acc))\\2\\3/i";
        $bool = preg_match_all($preg,$content,$res);
        $audios = array();
        if($bool){
            $audios = $res[4];
        }
        return array_unique($audios);
    }
    /*
     @desc:获取所有视频文件
     @return:所有匹配的视频文件
     */
    public function getvideo(){
        $content = $this->content;
        $preg="/(src)=(\\\?)([\"|‘]?)([^ \"‘>]+\.(swf|flv|mp4|rmvb|avi|mpeg|ra|ram|mov|wmv)((\?[^ \"‘>]+)?))\\2\\3/i";
        $bool = preg_match_all($preg,$content,$res);
        $videos = array();
        if($bool){
            $videos = $res[4];
        }
        return array_unique($videos);
    }
    /*
     @desc:获取所有段落文本
     @return:所有匹配的段落文本
     */
    public function getparagraph(){
        $content = $this->content;
        $preg="/<p>(.*)<\/p>/Ui";
        $bool = preg_match_all($preg,$content,$res);
        $paragraphs = array();
        if($bool){
            $paragraphs = $res[1];
        }
        return array_unique($paragraphs);
    }
    /*
     @desc:获取所有自定义内容
     @return:所有匹配的自定义内容
     */
    public function getuser($preg){
        $content = $this->content;
        $bool = preg_match_all($preg,$content,$res);
        $users = array();
        if($bool){
            $users = $res[1];
        }
        return array_unique($users);
    }
    }
  • 测试:
    $match = new match($str);
    $ret = $match->getimg();
    var_dump($ret);
  • 输出:
    array(7) {
    [0]=>
    string(61) "https://assets-cdn.github.com/images/search-shortcut-hint.svg"
    [1]=>
    string(69) "https://assets-cdn.github.com/images/spinners/octocat-spinner-128.gif"
    [2]=>
    string(75) "https://assets-cdn.github.com/images/spinners/octocat-spinner-32-EAF2F5.gif"
    [3]=>
    string(68) "https://assets-cdn.github.com/images/spinners/octocat-spinner-32.gif"
    [14]=>
    string(45) "https://badges.gitter.im/walkor/Workerman.svg"
    [15]=>
    string(48) "http://www.workerman.net/img/workerman-start.png"
    [16]=>
    string(42) "http://donate.workerman.net/img/donate.png"
    }
  • 原文地址:http://blog.51cto.com/12173069/2125724

    时间: 2024-10-31 04:32:02

    php正则匹配类的相关文章

    iOS 中的正则匹配(工具类)

    正则表达式 正则表达式是对字符串操作的一种逻辑公式, 用事先定义好的一些特定字符.及这些特定字符的组合, 组成一个"规则字符串", 这个"规则字符串"用来表达对字符串的一种过滤逻辑, 正则表达式就是用于描述这些规则的工具, 或者说, 正则表达式就是记录文本规则的代码. 在开发中, 我们经常会有查找符合某些复杂规则的字符串的需要, 比如数据校验: 判断用户的输入是否合法(如:用户注册的时候,QQ号码,电话号码,邮箱是否符合要求) 下面让我们先来看看正则匹配常用的一些字

    C#常用的正则工具类写法

    using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Text.RegularExpressions; using System.Collections; namespace ConsoleApplication1 { /// <summary> /// 字符串正则匹配帮助类 /// </summary> public static cla

    利用Python正则匹配中文——爬取校园网公告栏中感兴趣的内容

    写这个程序是因为校园网公告栏时不时会有学术报告,讲座之类的信息发布,但这类信息往往发布在讲座的前一天,以至于丢失很多重要消息.同时公告栏里也会发布一些跟学生无关的内容,比如工会主席会议啥的. 主要遇到的困难时对中文的正则匹配问题.(比如通过第一次正则可以提取到一个页面内的所有中文标题,第二次正则从这些中文标题中将能匹配上“报告”两个字的对象添加到结果list内) 学校公告页面是gb2312编码.我使用的方式是,整个工程使用utf-8编码,将需要匹配的关键字转换成utf-8编码格式,使用正则匹配u

    正则工具类以及FinalClass

    package com.jadyer.server.util; import java.util.regex.Pattern; /** * 正则工具类 * @see final class可以提高执行速度,原因如下 * @see 1)不涉及继承和覆盖 * @see 2)其地址引用和装载在编译时完成,而不是在运行期间由JVM进行复杂的装载,因而简单并有效 * @see 3)运行时不要求JVM执行因覆盖而产生的动态地址引用而花费时间和空间 * @see 4)与继承链上的一般对象相比,垃圾回收器在收回

    实现一个支持正则匹配的Filter以及Spring管理Filter遇到的问题

    相信很多人都会对Http的Filter的url-pattern不支持正则而烦恼吧.就比如,在web项目中Struts,当我们想要对所有的或者某一个Action进行过滤,而不过滤其他的Action,尤其是不想过滤静态资源,如果你的Struts配置了Action后缀可能会好一些,很可惜我的项目就没有设置后缀,所有没法使用url-pattern仅支持的几种规则,所以就自己实现了一个抽象类,用来支持可配置需过滤以及不需过滤的url规则,且支持正则,具体源码可见下方. import java.io.IOE

    正则匹配模式汇总(一)

    正则表达式提供另一种强大的文本搜索和处理方式,对于正则表达式,不同语言有着不同的实现,JavaScript采用的Perl5的语法.对于极少数匹配模式是简单的全字符文本的情况,我们往往会采用indexOf这样的方法,但是多数情况下,匹配模式往往都更为复杂. 1.语法 1)在JavaScript中我们可以采用内建构造器RegExp()来创建正则表达式的对象:  var re = new RegExp("j.*t") 2)当然除了使用RegExp对象,我们可以采用更为简便的正则文本标记法 v

    android经常使用正则工具类

    此类提供日常开发中经常使用的正则验证函数.比方:邮箱.手机号.电话号码.身份证号码.日期.数字.小数.URL.IP地址等.使用Pattern对象的matches方法进行整个字符匹配,调用该方法相当于: Pattern p = Pattern.compile(regex); Matcher m = p.matcher(input); return m.matches(); 每一个正则可能还有待优化的地方,您如有更好的方式实现某一个功能的验证,欢迎提出来大家一起讨论. 以下是工具类的完整代码: 源代

    Android常用正则工具类

    此类提供日常开发中常用的正则验证函数,比如:邮箱.手机号.电话号码.身份证号码.日期.数字.小数.URL.IP地址等.使用Pattern对象的matches方法进行整个字符匹配,调用该方法相当于:        Pattern p = Pattern.compile(regex);        Matcher m = p.matcher(input);        return m.matches();每个正则可能还有待优化的地方,您如有更好的方式实现某一个功能的验证,欢迎提出来大家一起讨论

    4-30 Java正则匹配

    做CC时经常要用正则表达式过滤数据,当时洗的数据比较复杂,规则比较多.这次做leetcode,复习一下Java的正则匹配.Leetcode 537. Complex Number Multiplication 从表示复数的字符串里把实部和虚部取出来. http://blog.csdn.net/yin380697242/article/details/52049999 Pattern类,构造函数是私有类型,不能通过new新建,要通过Pattern.compile()获得一个匹配模式.Pattern