java 获取HTML文本IMG标签的src地址

public static void main(String[] args) {
        String htmlText = "<p>的风格发的,多大的<img src=\"https://123.10.3.22:8080/File/uploadPictrue/20150917151201008.png\" /><img src=\"../File/uploadPic/2015/9/17/15/1118.png\" /></p>";
        GetHtmlImageSrcList(htmlText);
        System.out.println(GetHtmlText(htmlText));
    }

    /**
     * 获取HTML文件里面的IMG标签的SRC地址
     * @param htmlText 带html格式的文本
     */
    public static List<String> GetHtmlImageSrcList(String htmlText)
    {
        List<String> imgSrc = new ArrayList<String>();
        Matcher m = Pattern.compile("src=\"?(.*?)(\"|>|\\s+)").matcher(htmlText);
        while(m.find())
        {
            imgSrc.add(m.group(1));
        }
        return imgSrc;
    }

    /**
     * 去掉所有的HTML,获取其中的文本信息
     * @param htmlText
     * @return
     */
    public static String GetHtmlText(String htmlText)
    {
        String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式
        Pattern p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
        Matcher m_html = p_html.matcher(htmlText);
        htmlText = m_html.replaceAll(""); // 过滤HTML标签
        return htmlText;
    }
时间: 2024-11-05 14:38:55

java 获取HTML文本IMG标签的src地址的相关文章

Java获取操作系统的本机ip和Mac地址

获取局域网ip和mac(如果电脑没有直接连接外网),否则获取公网ip 通过第三放获取公网ip package org.twt.zipjar.test; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.net.Inet4Address; import java.net.InetAdd

C#正则表达式提取HTML中IMG标签的SRC地址

一般来说一个 HTML 文档有很多标签,比如"<html>"."<body>"."<table>"等,想把文档中的 img 标签提取出来并不是一件容易的事.由于 img 标签样式变化多端,使提取的时候用程序寻找并不容易.于是想要寻找它们就必须写一个非常健全的正则表达式,不然有可能会找得不全,或者找出来的不是正确的 img 标签.我们可以从 HTML 标签的格式去想应该怎么建这个正则表达式.首先要想一下 img

Java获取本机的IP与MAC地址

有些机器有许多虚拟的网卡,获取IP地址时会出现一些意外,所以需要一些验证: 1 // 获取mac地址 2 public static String getMacAddress() { 3 try { 4 Enumeration<NetworkInterface> allNetInterfaces = NetworkInterface.getNetworkInterfaces(); 5 byte[] mac = null; 6 while (allNetInterfaces.hasMoreEle

vue绑定动态img标签的src地址

<li v-for="(item,index) in images" :key="index"> <img :src="item.src"></li> 如果使用vue-lazyloader就是 <img v-lazy="item.src"></li> 用js动态加载assets或者本文件的图片出现404的状态码,是vue-lazyloader出现404的原因也是如此.

获取标签的src属性兼容性

获取节点如script标签的src属性时,针对非IE6,IE7可以直接使用src属性,但在IE6-7中存在问题,可以借助getAttribute方法 getAttribute(attr,iflag) iflag 取值: 0: 属性不区分大小写,但是返回一个被修改的值 1:区分大小写,必须严格和属性名匹配才能查找到 2:返回一个字符串,但是针对事件属性不适用 4:返回一个扩展的url,完整的url值,只针对url属性有效 官方文档:https://msdn.microsoft.com/en-us/

java获取System.out输出字符串

原文:java获取System.out输出字符串 源代码下载地址:http://www.zuidaima.com/share/1567106782268416.htm 最近有个需求想获取控制台输出的字符串,整理分享下,maven+junit. 版权声明:本文为博主原创文章,未经博主允许不得转载.

java 解析富文本处理 img 标签

很多项目都需要到富文本来添加内容,就好比新闻啊,旅游景点之类的,都需要使用富文本去添加数据,然而怎么我这边就发现了两个问题 1)怎样将富文本的图片的 src 获取出来? 2)后台上传的时候用的是相对路径,前端显示需要的是最对路径 我下面就记录一下解决这两个问题的方法 1):怎么将富文本的图片的  src 获取出来?很简单,就一个工具即可 public static List<String> getImgStr(String htmlStr) { List<String> list

UIWebView之获取所点位置的图片标签和src

UIWebView有自己的UIResgure,如果我们手动加入自己的GestureRecognize将不能识别,如UILongPressGestureRecongnizer. 在浏览网页的时候,如果看到喜欢的图片,想把它保存下来如何办呢? 我们可以自己写一个程序来实现,用uiwebview开发一个自己的浏览器. 上面说到uiwebview不能识别long press gesture,幸好有一个可以识别,那就是double click.因此我们注册它,代码如下 UITapGestureRecogn

从文本中提取图片路径(java 解析富文本处理 img 标签)

很多项目都需要到富文本来添加内容,就好比新闻啊,旅游景点之类的,都需要使用富文本去添加数据,然而怎么我这边就发现了两个问题 怎样将富文本的图片的 src 获取出来? 方法一: 利用正则表达式: public static List<String> getImgStr(String htmlStr) { List<String> list = new ArrayList<>(); String img = ""; Pattern p_image; Ma