【Jsoup学习礼记】从一个URL加载一个Document

存在问题

你需要从一个网站获取和解析一个HTML文档,并查找其中的相关数据。你可以使用下面解决方法:

解决方法

使用 Jsoup.connect(String
url)
方法:

Document doc = Jsoup.connect("http://example.com/").get();
String title = doc.title();

说明

connect(String
url)
 方法创建一个新的 Connection,
和 get() 取得和解析一个HTML文件。如果从该URL获取HTML时发生错误,便会抛出
IOException,应适当处理。

Connection 接口还提供一个方法链来解决特殊请求,具体如下:

Document doc = Jsoup.connect("http://example.com")
  .data("query", "Java")
  .userAgent("Mozilla")
  .cookie("auth", "token")
  .timeout(3000)
  .post();

这个方法只支持Web URLs (httphttps 协议);
假如你需要从一个文件加载,可以使用parse(File
in, String charsetName)
 代替。

时间: 2024-07-30 23:43:21

【Jsoup学习礼记】从一个URL加载一个Document的相关文章

【Jsoup学习礼记】从一个文件加载一个文档

问题 在本机硬盘上有一个HTML文件,需要对它进行解析从中抽取数据或进行修改. 办法 可以使用静态 Jsoup.parse(File in, String charsetName, String baseUri) 方法: File input = new File("/tmp/input.html"); Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/"); 说明 pa

Spring学习(一)tomcat加载web.xml、以及项目集成Spring支持

tomcat容器加载web.xml 一. 1 .启动一个 WEB 项目的时候, WEB 容器会去读取它的配置文件 web.xml ,读取 <listener> 和 <context-param> 两个结点. 2 .紧急着,容创建一个 ServletContext ( servlet 上下文),这个 web 项目的所有部分都将共享这个上下文. 3 .容器将 <context-param> 转换为键值对,并交给 servletContext . 4 .容器创建 <li

学习andriod开发之 异步加载图片(二)--- 使用其他进度条

大家好 我是akira上一节 我们讲到使用AsyncTask 这个类进行异步的下载 主要是涉及到一些图片的更新 这次我们继续上一个demo的改进 . 不知道你是否发现一个问题 上一节我们遗留了两个bug 1 在无网络情况下 点击会崩 咱们说 软件开发最忌讳的就是crash 而这个是在bug解决方案中的一级要解决的 所以这个问题 必须搞定 2 就是我们会发现进度并未更新 而图片是显示完毕了的 3 就是一个扩展 这次我将会带来 daimajia的新库 也是做库小达人的最新作品 NumberProgr

URL加载系统----iOS工程师必须熟练掌握

URL加载系统----iOS工程师必须熟练掌握 iOS根本离不开网络——不论是从服务端读写数据.向系统分发计算任务,还是从云端加载图片.音频.视频等. 当应用程序面临处理问题的抉择时,通常会选择最高级别的框架来解决这个问题.所以如果给定的任务是通过http://, https:// 或 ftp://进行通讯,那么与 NSURLConnection 相关的方法就是最好的选择了.苹果关于网络的类涵盖甚广,包括从URL加载.还存管理到认证与存储cookie等多个领域,完全可以满足现代Objective

学习EF之贪懒加载和延迟加载(2)

通过昨天对EF贪婪加载和延迟加载的学习,不难发现,延迟加载还是很好用的,但是问题也就来了,有的时候我们只需要加载一个实体,不需要和他相关的外部实体,这时候我们来看看EF延迟加载时怎么作用的吧 打开profiler 在Main函数入口处写一个查询,在Console.Read();处打一个断点 static void Main(string[] args) { var context = new EFDbContext(); var user = context.Users.FirstOrDefau

Android 编程下 WebView 加载一个网页如何得到网页的 Cookie 值

http://www.cnblogs.com/sunzn/archive/2013/04/03/2998113.html mWebView.setWebViewClient(new MyWebViewClient());mWebView.loadUrl(url); 最近做项目在手机端加载一个 WebView 进行网页第三方登录的时候,认证成功后会跳转到公司的网页中,手机客户端需要从网页中拿到 Cookies 携带的 UID 进行数据交互,这时我们可以在 WebViewClient 的 onPag

一个异步加载图片的公用类: EGOImageLoading

逛论坛的时候,发现偶尔还会有人在问怎么做图片的异步加载,很多回答都还是告知用原始的connection,收到数据NSData以后,再用UIImage initWithData生成图片对象.对于刚开始接触iOS开发的人来说,我还是推荐用这种方式的.但是对于已经有一定iOS开发经验的人来说,我推荐你们用比较成熟的第三方公用类.为什么这么说呢,1) 首先图片异步加载属于一个公共的问题空间,这部分的代码,对于所有需要加载网络图片的项目,逻辑都是一样的,也就是我们应     该把这部分代码做成可重用的,或

“无法加载一个或多个请求的类型。有关更多信息,请检索 LoaderExceptions 属性 “之解决

今天在学习插件系统设计的时候遇到一个问题:“System.Reflection.ReflectionTypeLoadException: 无法加载一个或多个请求的类型. 于是百度一下,很多内容都差不多,摘抄一个: ------------------------------ 今天突然遇到“System.Reflection.ReflectionTypeLoadException: 无法加载一个或多个请求的类型.有关更多信息,请检索 LoaderExceptions 属性.”这样的报错,找了好长时

一个loader加载多个swf

var _swfLoader:Loader; var _swfRequest:URLRequest; var _swfPathArr:Array = new Array("00.swf", "01.swf", "02.swf"); var _swfClipsArr:Array = new Array(); var _swfTempClip:MovieClip; var _loadedSWFs:int; startLoading(_swfPathA