Jsoup解析的例子 之 选择器

/***

Jsoup的选择器真的是很强大,多多尝试会感觉很有意思

*/

public class TestJsoup {
    
    public static void main(String[] args) {
        String str = "<a href=\"/2951/\">一汽-大众奥迪-<h1>奥迪Q3</h1></a>";
        parse("a",str);
        
        String  str1="<div class=\"breadnav fn-left\">当前位置:<a target=\"_self\" href=\"/\">首页</a>&nbsp;&gt;&nbsp;<a target=\"_self\" href=\"/suva/\">紧凑型SUV</a>&nbsp;&gt;&nbsp;<a target=\"_self\" href=\"/2951/\">奥迪Q3</a>&nbsp;&gt;&nbsp;综述</div>";
        parse("div.breadnav.fn-left a:nth-child(3)",str1);
        
        String str2 = "<div class=\"autoseries-info\"><dl><dt>新车指导价:<a>24.98-42.88万</a> <a>(15款车型)</a></dt><dt>二手车价格:<a></a></dt></dl></div>";
        parse("div.autoseries-info dt:contains(新车指导价) a:nth-child(1)",str2);
        
    }

private static void parse(String selector,String str) {
        Document doc = Jsoup.parse(str);
        Elements elements = doc.select(selector);;
        String text = elements.text();
        System.out.println(text.replaceAll(" ", ""));
        
    }
    
}

-------------------------------------------------------

jsoup中文帮助文档

http://www.open-open.com/jsoup/selector-syntax.htm

时间: 2024-10-23 13:43:44

Jsoup解析的例子 之 选择器的相关文章

Java 爬虫工具Jsoup解析

Jsoup是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址.HTML 文本内容.它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据. jsoup 的主要功能如下: 1. 从一个 URL,文件或字符串中解析 HTML: 2. 使用 DOM 或 CSS 选择器来查找.取出数据: 3. 可操作 HTML 元素.属性.文本: jsoup 是基于 MIT 协议发布的,可放心使用于商业项目. jsoup 可以从包括字符串.URL

利用jsoup解析天气预报

java的一个开源的解析Html的程序jsoup将html进行解析,并且让我们可以像对css操作一样来获取解析之后的内容,本文即利用其特性进行解析 jsoup的开源jar包请自行下载 public class WeatherInfo {     /**      * @param args      */     public static void main(String[] args) {         getCityWeatherInfo();         //getCityAndU

使用jsoup解析HTML之jsoup和HTML DOM简介

jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址.HTML文本内容.它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据.类似的解析器还有HTMLParser,使用的也比较广泛,但是HTMLParser缺少维护,发布的最后一个版本还停留在2006年(http://sourceforge.net/projects/htmlparser/files/). 在使用jsoup解析html之前,有必要对html的dom结构进行一个了解

Jsoup解析网页获取信息

毕设需要使用网页上的数据,然后就用到了JSOUP. Jsoup官网 既然是解析Html,首先要做的就是获取html这个页面,也就是要成功链接url. 就拿我做的举个例子,我需要解析获取我们学校官网上的新闻,链接地址为:http://www.chzu.edu.cn/s/1/t/1152/p/3/list.htm 界面如下: 首先创建一个java项目,引入jsoup包,我用的是jsoup-1.6.1.jar 然后就是写代码连接url Document doc; doc = Jsoup.connect

利用jsoup解析个人信息----图书馆客户端

上一篇HTTPclient模拟登陆交大图书馆解决了登陆,登陆之后便可以查看个人信息.个人信息条目较少,如图: 主要就是:姓名.电话.目前借书.积欠金额. 查看其html代码: 下面开始进行解析: 代码 package com.ali.login.spider; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; import com.ali.login.bean.Us

接口测试脚本之Jsoup解析HTML

第一次接触jsoup还是在处理收货地址的时候,当时在写一个下单流程,需要省市区id以及详细门牌号等等,因此同事介绍了jsoup,闲来无事,在此闲扯一番! 1.我们来看下,什么是jsoup,先来看看官方文档是怎么说的: jsoup: Java HTML Parser,jsoup is a Java library for working with real-world HTML. It provides a very convenient API for extracting and manipu

jsoup解析HTML DOM

使用jsoup 解析HTML ,使用与JS操作DOM类似. 实例代码: import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class ParserHtml { public static void main(String[] args

Jsoup解析html时对相对地址的处理

前一段时间运用htmlparser时,获取地址是时直接将html页面的相对地址转换成绝对地址,然而今天在运用jsoup,开始的时候发现只能得到相对地址,最后在网上寻找到了解决办法. htmlparser获得URLs: //参数说明:parser为模拟浏览器对URL地址操 dataPath:所解析的URL存放路径 dataName:存放URL的数据库名 public static void extractURL(final Parser parser, final String dataPath,

Jsoup解析网站输出gson数据

首先要导入jsoup跟gson的jar包. <span style="font-size:18px;">package com.bjsxt.test; import java.io.BufferedReader; import java.io.InputStream; import java.io.InputStreamReader; import java.net.URL; import java.net.URLConnection; import java.util.H