Jsoup获取部分页面数据失败 org.jsoup.UnsupportedMimeTypeException: Unhandled content type. Must be text/*, application/xml, or application/

用Jsoup在获取一些网站的数据时，起初获取很顺利，但是在访问某浪的数据是Jsoup报错，应该是请求头里面的请求类型(ContextType)不符合要求。

　　请求代码如下：

private static void testOuGuanMatch() throws IOException{
        Document doc = Jsoup.connect("我的URL").userAgent("Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.15)").timeout(5000).get();
        System.out.println(doc);
    }

　　能看到我这里设置了请求代理和相应时间。

　　报错信息如下：

org.jsoup.UnsupportedMimeTypeException: Unhandled content type. Must be text/*, application/xml, or application/xhtml+xml. Mimetype=application/javascript, URL=....
    at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:472)
    at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:424)
    at org.jsoup.helper.HttpConnection.execute(HttpConnection.java:178)
    at org.jsoup.helper.HttpConnection.get(HttpConnection.java:167)
    at calendarSpider.SpiderTest.testOuGuanMatch(SpiderTest.java:174)
    at calendarSpider.SpiderTest.main(SpiderTest.java:39)

　　在google上查找到了解决方法：添加ignoreContentType(true)

　　修改后代码：

private static void testOuGuanMatch() throws IOException{
        Document doc = Jsoup.connect("我的URL").ignoreContentType(true).userAgent("Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.15)").timeout(5000).get();
        System.out.println(doc);
    }

　　那这里的ignoreContentType(true)看词就知道忽略ContextType的检查
---------------------
作者：就算曾经遍体鳞伤也要相信明天
来源：CSDN
原文：https://blog.csdn.net/u010177899/article/details/68061324
版权声明：本文为博主原创文章，转载请附上博文链接！

原文地址：https://www.cnblogs.com/GH0522/p/9837604.html

时间： 2024-10-09 22:02:42

Jsoup获取部分页面数据失败 org.jsoup.UnsupportedMimeTypeException: Unhandled content type. Must be text/*, application/xml, or application/的相关文章

Jsoup问题---获取http协议请求失败 org.jsoup.UnsupportedMimeTypeException: Unhandled content type. Must be text/*, application/xml, or application/xhtml+xml.

Jsoup问题---获取http协议请求失败 1.问题:用Jsoup在获取一些网站的数据时,起初获取很顺利,但是在访问某浪的数据是Jsoup报错,应该是请求头里面的请求类型(ContextType)不符合要求. 错误信息: Exception in thread "main" org.jsoup.UnsupportedMimeTypeException: Unhandled content type. Must be text/*, application/xml, or applic

Jsoup获取部分页面数据失败 org.jsoup.UnsupportedMimeTypeException: Unhandled content type. Must be text/*, application/xml, or application/

Jsoup获取部分页面数据失败 org.jsoup.UnsupportedMimeTypeException: Unhandled content type. Must be text/*, application/xml, or application/的相关文章

Jsoup问题---获取http协议请求失败 org.jsoup.UnsupportedMimeTypeException: Unhandled content type. Must be text/*, application/xml, or application/xhtml+xml.

js子页面获取父页面数据

Jsoup获取全国地区数据（省市县镇村）(续) 纯干货分享

selenium 操作获取动态页面数据

使用Jsoup获取网页内容超时设置

使用Jsoup 抓取页面的数据

Jsoup 爬取页面的数据和理解HTTP消息头

jsoup截取HTML页面中的节点

android中使用JSOUP如何解析网页数据详述