java 对于url地址的实体符号的处理

<!-- https://mvnrepository.com/artifact/org.apache.commons/commons-lang3
        <dependency>
            <groupId>org.apache.commons</groupId>
            <artifactId>commons-lang3</artifactId>
            <version>3.4</version>
        </dependency>
-->

public static String getNextPage(String web) throws Exception {
        HttpComponentsClientHttpRequestFactory factory=new HttpComponentsClientHttpRequestFactory();
//        factory.setConnectTimeout(60000);
//        factory.set
        String regx="上一页</a>)(<a.*?href=[\\\"‘]?(((http|https)?://)?/?[^\\\"‘]+)[\\\"‘]?.*?>(.+)</a>";
        RestTemplate template=new RestTemplate();
        URI uri=new URI(URLDecoder.decode(web,"utf-8"));
        String stri = template.getForObject(uri, String.class);
        Pattern pattern=Pattern.compile(regx);
        Matcher matcher = pattern.matcher(stri);
        matcher.find();
        String group = matcher.group();
        group = group.substring(group.indexOf("href=\"/") + 7, group.indexOf("\" title=\""));
        group="http://www.youbianku.com/"+group;
        group= StringEscapeUtils.unescapeHtml4(group);
        return group;

    }
时间: 2024-11-29 01:02:33

java 对于url地址的实体符号的处理的相关文章

Java获取url地址图片

package com.listings.web.controller; import java.io.DataInputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.net.HttpURLConnection; import java.net.URL; import java.util.Date; public class CatchPic { public stati

url地址中 &quot;&amp;&quot; &quot;/&quot;等符号的转义处理(转)

URL出现了有+,空格,/,?,%,#,&,=等特殊符号的时候,可能在服务器端无法获得正确的参数值,如何是好? 解决办法:将这些字符转化成服务器可以识别的字符,对应关系如下: URL中的特殊字符 有些符号在URL中是不能直接传递的,如果要在URL中传递这些特殊符号,那么就要使用他们的编码了.编码的格式为:%加字符的ASCII码,即一个百分号%,后面跟对应字符的ASCII(16进制)码值.例如 空格的编码值是"%20". 下表中列出了一些URL特殊符号及编码 + URL 中+号表

url地址中 &quot;&amp;&quot; &quot;/&quot;等符号的转义处理

URL出现了有+,空格,/,?,%,#,&,=等特殊符号的时候,可能在服务器端无法获得正确的参数值,如何是好? 解决办法:将这些字符转化成服务器可以识别的字符,对应关系如下: URL中的特殊字符 有些符号在URL中是不能直接传递的,如果要在URL中传递这些特殊符号,那么就要使用他们的编码了.编码的格式为:%加字符的ASCII码,即一个百分号%,后面跟对应字符的ASCII(16进制)码值.例如 空格的编码值是"%20". 下表中列出了一些URL特殊符号及编码 + URL 中+号表

URL地址中中文乱码详解(javascript中encodeURI和decodeURI方法、java.net.URLDecoder.encode、java.net.URLDecoder.decode)

引言: 在Restful类的服务设计中,经常会碰到需要在URL地址中使用中文作为的参数的情况,这种情况下,一般都需要正确的设置和编码中文字符信息.乱码问题就此产生了,该如何解决呢?且听本文详细道来. 1.  问题的引出 在Restful的服务设计中,查询某些信息的时候,一般的URL地址设计为: get /basic/service? keyword=历史 , 之类的URL地址. 但是,在实际的开发和使用中,确是有乱码情况的发生,在后台的读取keyword信息为乱码,无法正确读取. 2. 乱码是如

JAVA 取得当前目录的路径/Servlet/class/文件路径/web路径/url地址

JAVA 取得当前目录的路径/Servlet/class/文件路径/web路径/url地址 在写java程序时不可避免要获取文件的路径...总结一下,遗漏的随时补上1.可以在servlet的init方法里String path = getServletContext().getRealPath("/");这将获取web项目的全路径例如 :E:\eclipseM9\workspace\tree\tree是我web项目的根目录 2.你也可以随时在任意的class里调用this.getCla

用java程序直接访问URL地址

/**       * 程序中访问http数据接口       */      public static String getURLContent(String urlStr) {                     /** 网络的url地址 */           URL url = null;                    /** http连接 */       HttpURLConnection httpConn = null;                   /**/

java &nbsp; net --------------------------------URL类

java   net ---------------------------URL类 package java_net; import java.net.MalformedURLException; import java.net.URL; /*  * 测试URL类  */ public class URL_Test {  public static void main(String[] args) { try { //我们需要构造一个URL对象,构造方法有很多种 /*  * 1.通过一个字符串

jsp传递url地址里带有&amp;的无法接收的解决方法

当需要传递url地址的时候,比如修改带有分页的帖子后.需要传递页码当修改完毕后可以跳回修改的页面.当有&这个符号时.request只能取得不到这个符号,和这个符号的内容. 比如传递的url地址 http://localhost/newbbs/update.jsp?id=32&urlname=http://localhost/newbbs/articledetailflat.jsp?rootid=30&pageno=2 通过request.getParmeter("urln

URL地址重写例子(Helicon)

# Helicon ISAPI_Rewrite configuration file# Version 3.1.0.86 #RewriteEngine on RewriteRule ^/esf/.+(/.+){4,}$ /404.aspx?$0RewriteRule ^/esf/attn_1$ /esf/qh1/ [NC,R=301]RewriteRule ^/esf/attn_1_sid_0$ /esf/qh1/ [NC,R=301]RewriteRule ^/zuf/attn_1$ /zuf