Jsop入门程序

package com.baidu;

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class JsoupNode {
/*
* jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。
* 它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。
*/
public static void main(String[] args) throws IOException {
// htmlDemo();//html 格式化
// htmlTitle();//获取一个网站的头信息
// htmlPost();//获取网站的信息
// htmlBody();
htmlQuery();
}

public static void htmlQuery() throws IOException {
Document doc = Jsoup.connect("http://example.com")
.data("query", "Java")//请求
.userAgent("Mozilla")//userAgent
.cookie("auth", "token")//cookie
.timeout(3000).post();//请求方式
System.out.println(doc);
}

public static void htmlBody() {
String html = "<div><p>Lorem ipsum.</p>";
Document doc = Jsoup.parseBodyFragment(html);
Element body = doc.body();
System.out.println(body);
}

public static void htmlDemo() {
// 直接从字符串中输入 HTML 文档
String html = "<html><head><title> 开源中国社区 </title></head>"
+ "<body><p> 这里是 jsoup 项目的相关文章 </p></body></html>";
Document doc = Jsoup.parse(html);
System.out.println(doc);
}

public static void htmlTitle() throws IOException {
// 从 URL 直接加载 HTML 文档(头信息)
Document doc = Jsoup.connect("http://www.baidu.com/").get();
String title = doc.title();
System.out.println(title);
}

public static void htmlPost() throws IOException {
// 从 URL 直接加载 HTML 文档
Document doc = Jsoup.connect("http://www.baidu.com/")
.data("query", "Java") // 请求参数
.userAgent("I ’ m jsoup") // 设置 User-Agent
.cookie("auth", "token") // 设置 cookie
.timeout(3000) // 设置连接超时时间
.post(); // 使用 POST 方法访问 URL
System.out.println(doc);
}
}

时间： 2024-10-11 19:50:51

Jsop入门程序的相关文章

Mahout学习之Mahout简介、安装、配置、入门程序测试

一.Mahout简介查了Mahout的中文意思--驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了... 附logo: (就是他,骑在象头上的那个Mahout) 步入正文啦: Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现.分类.聚类等.Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的

springmvc入门程序

springmvc的入门程序(和前面的mybatis使用同一个案例,商城的案例.订单,购物车等) 需求: 功能需求: 商品的列表查询环境准备: Java环境: Jdk1.7 Myeclipes9 Springmvc版本:spring3.2 需要spring3.2所有jar,一定要包括spring-webmvc那个开发步骤: 1.导入jar包,这个不解释了. 2.在web.xml中配置前端控制器: <servlet> <servlet-name>springmvc</ser

ant入门程序

一. ant简介 Ant是apache的一个核心项目, 它的作用是项目自动化构建, 因为它内置了Javac.Java.创建目录.复制文件等功能, 直接运行build.xml文件就可以编译我们的项目. 二. ant配置 1. 新建环境变量ANT_HOME: ant的解压目录 2. 在path中配置:%ANT_HOME%/bin; 3. 在命令行中输入ant, 如果出现 Buildfile:build.xml does not exist! Build failed 说明配置成功三. ant入门程

python web入门程序

python2.x web入门程序 #!/usr/bin/python # -*- coding: UTF-8 -*- # 只在python2.x 有效 import os #Python的标准库中的os模块包含普遍的操作系统功能 import re #引入正则表达式对象 import urllib #用于对URL进行编解码 from BaseHTTPServer import HTTPServer, BaseHTTPRequestHandler #导入HTTP处理相关的模块 #自定义处理程序,

MyBatis 介绍、简单入门程序

JDBC 编程中的问题 1. 将 SQL 语句硬编码到 Java 代码.不利于系统维护. 设想怎样解决:将SQL单独抽取出来,在配置文件(xml方式.properties文件)进行配置. 2. 数据库连接不能反复利用,对数据库资源是一中浪费. 设想怎样解决:使用数据库连接池管理数据库连接. 3. 向 Statement 设置參数时,对于參数的位置通过硬编码指定,不利于系统维护. 设想怎样解决:是否可以自己主动将 Java 对象的值设置到 Statement. 4. 遍历结果集.resultSet

struts2入门程序

1.搭建struts2环境开发的步骤搭建struts2环境时,我们一般需要做一下几个步骤的工作: 1. 创建javaweb工程 2. 找到开发struts应用所需要使用的jar 3. 创建jsp文件 4. 创建action文件 5. 编写struts2的配置文件 6. 在web.xml中加入struts2 MVC框架启动配置开发struts2中需要使用的基本jar包: 关于struts2的提示: 我的myeclipes默认的struts2提示只到2.1,如果需要有2.3的提示,有

.Net 转战 Android 4.4 日常笔记（2）--HelloWorld入门程序

原文:.Net 转战 Android 4.4 日常笔记(2)--HelloWorld入门程序我不知道人们为什么那么喜欢用HelloWorld来做为自己的第一个程序入门,为什么不是hello **其他的东西或者hi. 一.打开ADT 的Eclipse开发工具新建一个Android项目 New----> Android Application Project Minimum Required SDK这个是运行hello world的最低android版本 Target SDK是现在的目标版本 Co

mybatis入门_mybatis基本原理以及入门程序

一.传统jdbc存在的问题 1.创建数据库的连接存在大量的硬编码, 2.执行statement时存在硬编码. 3.频繁的开启和关闭数据库连接,会严重影响数据库的性能,浪费数据库的资源. 4.存在大量的重复性编码二.mybatis执行流程 Mybatis基本的执行流程如下图所示: 三.mybatis入门程序 3.1 通过mybatis完成通过主键(id)查询用户(user) 3.1.1.项目环境搭建建立的是Java项目.采用的mybatis版本为3.2.7. 需要导入mybatis核心jar包

springMVC2 1入门程序

1入门程序 1.1需求实现商品列表查询 1.2需要的jar包使用spring3.2.0(带springwebmvc模块) 1.1前端控制器在web.xml中配置: <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://java.sun.c

猜你喜欢

python第二天基础1-1

一.作用域对于变量的作用域,执行声明并在内存中存在,该变量就可以在下面的代码中使用. if 1==1: name = 'wupeiqi' print name 二.三元运算 result = 值1 ...

四轴飞行器1.3 MPU6050(大端)和M4的FPU开启方法

原创文章,欢迎转载,转载请注明出处最近时间花在最多的地方就是STM32的I2C上了.之前就知道STM32的I2C并不好用,因为之前用过模拟的I2C,也写过AVR的I2C也就是TWI的硬件 ...

直播疑难杂症排查（7）— 黑屏、花屏、闪屏问题

本文是 <直播疑难杂症排查>系列的第七篇文章,我们来重点看看直播中常见的各种黑屏.花屏.闪屏问题. 首先我们要明白,黑屏.花屏.闪屏等问题,可能是推流端的问题,也可能是播放器的问题,遇到这 ...

一张图记住TCP/IP通讯中的IP地址配置

TCP/IP通讯情景: 用网线将计算机A(服务器Server)和计算机B(Client)连接起来.程序代码在计算机A中,计算机B中安装有TCP/IP通讯助手. (图中屏幕大的是计算机A,屏幕小的笔记本 ...

Java网络编程从入门到精通（9）：使用isXxx方法判断地址类型

IP地址分为普通地址和特殊地址.在前面的文章中所使用的大多数都是普通的IP地址,在本文中将介绍如何利用InetAddress类提供的十个方法来确定一个IP地址是否是一个特殊的IP地址. 一.isAny ...

wcf services host in a console application

一个serviceHost多个wcf服务,宿主为console 1 using System; 2 using System.Collections.Generic; 3 using System.L ...

cache和buffer介绍

今天被人问及什么是cache,什么是buffer,两者之间的区别是什么,作为菜鸟的我蒙了.我只知道cache是内存的闲置空间用来缓存数据块的,以提高数据读取的速率,而buffer是缓冲区,但是具体含义 ...

354. Russian Doll Envelopes

从我花时间上看,我是纠结排序很久.注意一下Comparator的写法,以后会了就好~ 算法上讲,就是对envolope尺寸排序,然后对于排序后的每个信封,它可以装进的最多小信封数,是长宽都比它小的信封 ...

easyui tab 加载iframe 高度问题

其实按网上搜的结果,easyui 有个data-options属性是fit:true. 加上他之后会使得自适应父类的宽高. 加上之后,发现个问题,当刷新tab内容的时候高度是对的,但是新建tab的时候 ...

C语言算法：十进制转为二进制

#include<stdio.h> int main() { int b,i,c=0,a[30]; scanf("%d",&b); while(b!=0) { ...

【C语言】练习1-21

题目来源:<The C programming language>中的习题练习1-21:编写程序entab,将空格串替换为最好数量的制表符和空格,但要保持单词之间的间隔不变. 思路: 对 ...

jQuery页面滚动监听事件及高级效果插件

jQuery页面滚动监听事件及高级效果插件 1. One Page scroll (只适用于上下焦点图)http://www.thepetedesign.com/demos/onepage_scrol ...

在一个按行列递增的二维数组中查找一个数是否存在

唯一要求:二维数组按行列递增巧妙的利用二分法的特性,先跟右上角的元素相比,大于行+1,小于列-1,否则返回行列 #include<iostream> using namespace st ...

【11g体系结构，5】rowid

一.rowid 扩展的rowid 使用以64为基数的编码方案来显示. rowid简单理解为数据的身份证号,总共18位,6位对象号,3为文件号,6位块号,3位行号. rowid前15位表示块地址,前15 ...

Java 构造函数问题

JAVA一个类有两个构造函数,当在一个构造函数中调用另外一个构造函数时为什么要用this.()而不能用类名.() 如果存在参数类型可以,如果类型也完全相同的话则不行,只能另外取一个名字.方法重载是指在 ...

JS获取网页窗口大小、浏览器窗口大小、页面元素位置

来自阮一峰的网络日志>>http://www.ruanyifeng.com/blog/2009/09/find_element_s_position_using_javascript.h ...

互斥量和查用户权限

STDMETHODIMP CSoftCheck::CheckUserAccount(BOOL *isAol) { long rtVal = 0; HKEY hKey = 0; rtVal = RegC ...

移植最新内核3.4.2

一. 内核启动流程,据此配置内核(机器ID)1.1 修改Makefile1.2 选择默认配置 : make s3c2410_defconfig1.3 make uImage 步骤1:在UBOOT里: ...

Android -- 利用Broadcast开启Service(转)

Broadcast和Service都是Android四大组建之一的. 这里的广播是动态的,自己注册的一个广播. 这种最典型的用法就是利用开机广播,然后再起自己的服务,也就是在Android手机中做到开 ...

【第一课】WordPress - 初识WordPress

好久前就听疯哥使用WP,说可以快速建站,从今,就开始WP学习之旅! HA``` 参考链接: WordPress官网:http://cn.wordpress.org/ MAC 安装WordPress : ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.