java通过URL获取文本内容

原文地址https://www.cnblogs.com/myadmin/p/7634262.html

public static String readFileByUrl(String urlStr) {
        String res=null;
        try {
            URL url = new URL(urlStr);
            HttpURLConnection conn = (HttpURLConnection)url.openConnection();
            //设置超时间为3秒
            conn.setConnectTimeout(3*1000);
            //防止屏蔽程序抓取而返回403错误
            conn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
            //得到输入流
            InputStream inputStream = conn.getInputStream();
            res = readInputStream(inputStream);
        } catch (Exception e) {
            logger.error("通过url地址获取文本内容失败 Exception:" + e);
        }
        return res;
    }

/**
     * 从输入流中获取字符串
     * @param inputStream
     * @return
     * @throws IOException
     */
    public static String readInputStream(InputStream inputStream) throws IOException {
        byte[] buffer = new byte[1024];
        int len = 0;
        ByteArrayOutputStream bos = new ByteArrayOutputStream();
        while((len = inputStream.read(buffer)) != -1) {
            bos.write(buffer, 0, len);
        }
        bos.close();
        System.out.println(new String(bos.toByteArray(),"utf-8"));
        return new String(bos.toByteArray(),"utf-8");
    }  

原文地址:https://www.cnblogs.com/111testing/p/8152064.html

时间: 2024-11-03 23:43:58

java通过URL获取文本内容的相关文章

JAVA通过url获取页面内容

String address = "http://sports.sina.com.cn/nba/live.html?id=2015050405"; URL url = new URL(address); HttpURLConnection connection = (HttpURLConnection)url.openConnection(); InputStreamReader input = new InputStreamReader(connection.getInputStre

Get Text关键字——用来获取文本内容

Get  Text关键字:用来获取文本内容: 接受一个参数 [ locator ],locator参数指的是定位界面元素的方式: ============================================================= 示例:打开百度首页,获取name=tj_trnews包含的文本内容: Open Browser    http://www.baidu.com    chrome ${text} Get  Text    name=tj_trnews     

使用java.net.URL获取网页编码

在同一个类中 需要导入以下的包: import java.net.MalformedURLException;import java.net.URL;import java.net.URLConnection; 1 @Test 2 public void e() throws MalformedURLException, IOException{ 3 System.out.println(testgetCharset()); 4 } 5 public String testgetCharset(

通过html()的方法获取文本内容, form表单组件显示的值与获取到的值不一致的问题

我在通过 html()获取对应节点的内容,发现一个问题,获取到的 form表单组件的内容值是初始加载的值,而不是经过用户修改后的值.例如页面加载时组件<input type="text" value="111111"/>,用户更改表单的值为 222222,通过父节点的html()方法获取这个组件,预期应该是<input type="text" value="222222"/>,可结果却是初始时的样子&l

fopen()、 file_get_contents() 通过url获取链接内容

功能:获得网页内容 区别如下: fopen()打开URL 下面是一个使用fopen()打开URL的例子: <?php $fh = fopen('http://www.baidu.com/', 'r'); if($fh){     while(!feof($fh)) {         echo fgets($fh);     } } ?> 从此例子可以看到,fopen()打开网页后,返回的$fh不是字符串,不能直输出的,还需要用到fgets()这个函数来获取字符串.fgets()函数是从文件指

java如何URL获取下载的文件名

HttpURLConnection httpConnection = (HttpURLConnection) url.openConnection(); String str= httpConnection.getHeaderField("Content-Disposition"); 见图

java根据url获取完整域名

private String getDomain(String destination){ if(destination==null||destination.trim().equals("")){ return ""; } String domain = ""; URL url =null; try { url= new URL(destination); domain =url.getProtocol()+"://"+ur

java通过正则表达式获取文本中的浮点数

package javaDemo; import java.util.regex.Matcher; import java.util.regex.Pattern; public class GetNumFromString { /** * @songwenju */ public static void main(String[] args) { String str = "Java教程12.50"; String regex = "\\d*[.]\\d*"; Pa

Java(springboot) 读取txt文本内容

public class TxtTest { private static final Logger logger = LoggerFactory.getLogger(TxtTest.class); public static String readTxt(File file) throws IOException { String s = ""; InputStreamReader in = new InputStreamReader(new FileInputStream(file