双色球2013年统计,从网上爬虫出来的

package com.hpu.bai;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.Writer;
import java.net.URL;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class Double2013 {
	public static void main(String[] args) throws Exception {
		Document doc;
		File file = new File("d:\\双色球第2013015期到2013154期开奖结果.txt");
		FileOutputStream fos = new FileOutputStream(file);
		//while(true){
			for(int i = 2013015;i<=2013154;i++){
			String url = "http://caipiao.163.com/award/ssq/"+i+".html";
			doc  = (Document) Jsoup.connect(url).get();
			//String title = doc.title();
			//Elements ele = doc.select("div.search_zj_left p.red_ball span");
			Element content = doc.getElementById("zj_area");
			Elements links = content.getElementsByTag("span");
			//System.out.println(links.size());
			int count =0;byte[] b = new byte[1024];
			for (Element link : links) {
				count++;
				//String linkHref = link.attr("href");
				String linkText = link.text();
				//System.out.print(linkHref);
				System.out.print(" "+linkText);
				//linkText.toCharArray();
				linkText = " "+linkText;
				 b = linkText.getBytes();
				fos.write(b);
				if(count%7 == 0){
					fos.write("\r\n".getBytes());
				}
				}
				System.out.println();
			//String ball = ele.text();
			/*Element dayFav = doc.getElementsByAttributeValue("class", "linkRight").first();
			Elements dayFavItems = dayFav.getElementsByTag("a");
			for (Element dayFavItem:dayFavItems) {
				System.out.println(dayFavItem.text());
			} */
			//System.out.println(title);
			//System.out.println(ball);
			Thread.sleep(1500);
			}
		//}
	fos.flush();fos.close();
	}
}

其中用到了jsoup的东西,具体的还不太会用。QQ:623687677.Java初学者

时间: 2024-10-25 04:28:02

双色球2013年统计,从网上爬虫出来的的相关文章

人工智能深度学习神经网络在双色球彩票中的应用研究

人工神经网络(Neural Networks)在双色球彩票中的应用研究网上已经有比较多的研究论文和资料,最近比较火的AlphaGo中用到的深度学习在双色球预测上还没有相关论文,以后研究成果出来将逐步更新内容. 人工智能神经网络是什么? 神经网络的好处就是可以自己纠正,可以自己生成节点,错误的输入也可以给你输出接近正确的结果.这个就是为什么叫做智能,他会自动根据情况跟人脑思维一样进行学习,进化而不是单纯的执行命令了. 普通过滤算法就是单线的执行,根据我的输入根据写好的逻辑算法直接给出输出,没有自动

[转载]爬虫的自我解剖(抓取网页HtmlUnit)

网络爬虫第一个要面临的问题,就是如何抓取网页,抓取其实很容易,没你想的那么复杂,一个开源HtmlUnit包,4行代码就OK啦,例子如下: 1 2 3 4 final WebClient webClient=new WebClient(); final HtmlPage page=webClient.getPage("http://www.yanyulin.info"); System.out.println(page.asText()); webClient.closeAllWindo

网站统计中的数据收集原理及实现

转载自:http://blog.sina.com.cn/s/blog_62b832910102w5mx.html Avinash Kaushik将点击流数据的获取方式分为4种:log files.web beacons.JavaScript tags和packet sniffers,其中包嗅探器(packet sniffers)比较不常见,最传统的获取方式是通过WEB日志文件(log files):而beacons和JavaScript是目前较为流行的方式,Google Analytics目前就

Shell 中常见的日志统计方法

前面我发布过"Hadoop兮,杀鸡别用牛刀,python+shell实现一般日志文件的查询.统计", 需要结合python, 可能还是有一定的门槛, 现将shell部分剥离出来. 举例一些最基本的日志统计方法. (1)查看文件 more crawler.log 查看crawler.log日志 tail -n 100 crawler.log 查看crawler.log的最后100行 (2)匹配统计 cat *.log | grep "ERROR" |wc -l 统计在

3星|《小趋势2》:根据统计数据来分析点评美国社会

小趋势2:复杂世界中的微变量(洞察世界.把握未来的关建变量) 英文书名的本意是“小趋势的平方”,中文书的标题中的2也是平方的意思.不过卖书网站上的书名不支持平方的符号,书名都被写成了“小趋势2”. 从实际内容来看,“小趋势2”比“小趋势的平方”更合适. 主要内容是根据统计数据来分析点评美国社会的一些变化.涉及到婚恋.健康.科技.生活方式.政治.工作等6个方面.以上6个领域各有多篇文章.依据的事实是比较可信的机构给出的统计数据和研究结论,作者的结论因此也比较靠谱. 内容上来看,有一些是离中国比较远

[转载] TLS协议分析 与 现代加密通信协议设计

https://blog.helong.info/blog/2015/09/06/tls-protocol-analysis-and-crypto-protocol-design/?from=timeline&isappinstalled=0 最近发现密码学很有意思,刚好还和工作有点关系,就研究了一下,本文是其中一部分笔记和一些思考. 密码学理论艰深,概念繁多,本人知识水平有限,错误难免,如果您发现错误,请务必指出,非常感谢! 本文禁止转载 本文目标: 学习鉴赏TLS协议的设计,透彻理解原理和重

Java学习之多线程二

1.wait和sleep的区别 sleep: 不释放锁对象, 释放CPU使用权 在休眠的时间内,不能唤醒 wait: 释放锁对象, 释放CPU使用权 在等待的时间内,能唤醒 2.线程的生命周期(五中状态的切换流程)  新建(new Thread) 当创建Thread类的一个实例(对象)时,此线程进入新建状态(未被启动). 例如:Thread  t1=new Thread();  就绪(runnable) 线程已经被启动,正在等待被分配给CPU时间片,也就是说此时线程正在就绪队列中排队等候得到CP

关于Java字符串的几个重点

String.StringBuilder和StringBuffer哪个更优? String和StringBuilder:StringBuilder是可变的,也就是说用StringBuilder创建的字符串你可以随时改变它.StringBuilder和StringBuffer:StringBuffer是同步的,它是线程安全(thread-safe)的,但效率要比StringBuilder差得多. 如何重复输出字符串? 在Python中,我们只需要为字符串乘上一个数字就可以重复输出该字符串了.然而在

手把手生成决策树(dicision tree)

手把手生成决策树(dicision tree) 主要參考资料: Peter HARRINGTON.机器学习实战[M].李锐,李鹏,曲亚东,王斌译.北京:人民邮电出版社, 2013. 李航.统计学习方法[M].北京:清华大学出版社, 2012 原文链接:http://blog.csdn.net/xuelabizp/article/details/50979469 1.什么是决策树 决策树是一种主要的分类和回归方法.本文主要解说用于分类的决策树. 决策树就是依据相关的条件进行分类的一种树形结构,比方