CSDN博文下载器(JAVA)

自己用JAVA做的CSDN博文下载器,提供jar包和源码。

源码也公开吧,反正jar反编译也能得到源码,新手不会jar加密。

资源csdn在审核吧...好慢

考虑到上课的时候看博客不方便,想把好的博客全部下载下来,在手机上看。

各种百度,找到了几个工具。

1.http://blog.csdn.net/gzshun/article/details/7555525

大神写了思路和教程,用他的工具发现的问题:

(1)下载不完全,测试只能下载第一页的21篇文章左右。

(2)生成的pdf看着还行,代码部分有的超出pdf页面范围,导致看不到,不方便

2.http://www.cr173.com/soft/48129.html

这个大神写的通用博客导出工具,好像接口有变化,失效了,导出不了。

我就在琢磨自己写个程序出来。

好了,有了http://blog.csdn.net/gzshun/article/category/932960 前辈的思路。

扩展了一下,自己的思路:

(1)电脑版改为手机版

个人感觉手机版csdn更精简,处理起来肯定方便,链接是http://m.blog.csdn.net/blog,后面加用户名就是该用户的博客了,这里要区别用户名和自定义域名,电脑版的博客链接一般是自定义域名,例如:我的电脑版csdn博客自定义域名是:noaboutfengyue,我的用户名是:oWuGuanFengYue123,电脑版中http://blog.csdn.net/加这两个都可以跳转到博客,但是在手机版中只能访问 http://m.blog.csdn.net/blog/oWuGuanFengYue123打开博客。

为了使用方便,程序只需读入自定义域名就能下载,所以,增加个方法,功能是通过域名获得用户名,实现很简单,打开http://blog.csdn.net/noaboutfengyue,源码中就有oWuGuanFengYue123用户名,通过正则表达式解析就Ok。

(2)采用ITEXT从html生产pdf

在http://blog.csdn.net/noaboutfengyue/article/details/45174787中已经说明

(3)获取所有文章列表

经测试发现http://m.blog.csdn.net/blog/oWuGuanFengYue123?page= 这个page是文章页数,当这个数字很大时,大过文章页数,取个极限,99999,http://m.blog.csdn.net/blog/oWuGuanFengYue123?page=999999,显示的就是所有文章

(4)文章列表的获取和文章内容的解析

在(3)中获取的页面,通过正则表达式,解析出所有文章标题和url,然后通过这个url得到html源码,由于使用IText,对html源码的格式要求很严,所以这里要进行预处理(这里做的有点不完善),比如<br>报错,必须改成<br/>,还有一些,然后直接转换成pdf输出。

(5)增加序号

为了使生成出来的pdf有序,按照作者第一篇博文开始编号。生成出来的文件名是  1.标题.pdf

思路大概就这些,细节方面有些要处理。

使用说明:

下载目录在当前程序目录/csdn/用户名

演示一下吧。

用http://m.blog.csdn.net/blog/lmj623565791 这个老师的来演示,博客写得很好。

处理过程显示:

还是有些地方处理的不完善,大致上处理还不错,能生成大部分pdf。

结果:

就这样了,哈哈,世界清净了。

不说了,我去下载好的博客去了,上课了去看。

复制去Google翻译翻译结果

时间: 2024-11-01 11:26:56

CSDN博文下载器(JAVA)的相关文章

Java实现的一个简单的下载器

package com.shawearn.download;import java.io.BufferedInputStream;import java.io.BufferedOutputStream;import java.io.DataInputStream;import java.io.DataOutputStream;import java.io.EOFException;import java.io.File;http://www.huiyi8.com/jiaoben/import j

csdn免积分下载器最可用版

csdn免积分下载器最新版,亲测有效.一键即可下载! 只需输入csdn文件的下载地址,如 http://download.csdn.net/detail/md521/5172505 输入验证码.点击"解析地址".出现"获取成功"提示, 然后在下载地址处.单击鼠标右键,出现"复制成功"提示,如上图所示. 将复制的文件下载地址在浏览器中打开即可下载! csdn免积分下载器下载地址:http://aibing.cc/pojie/2607.shtml

JAVA下载器

package com.longneo.downloader; import java.awt.*; import java.awt.event.*; import java.io.FileOutputStream; import java.io.InputStream; import java.net.URL; import java.net.URLConnection; import javax.swing.*; public class Downloader { private Dimen

CSDN免积分下载器下载 2018 最新免费版

CSDN免积分下载器是一款CSDN网站资源下载工具,CSDN下载器可以免登陆免积分下载需要积分的资源,不用再去为积分问题而苦恼.由于CSDN不知道什么时候会继续改版或者变动,所以不保证这个CSDN免积分下载器的长期有效哦. CSDN上有很多用户上传的好资料,不过好些都需要下载积分,很多网友总是搜到了CSDN的资源刚好是自己想要的东西结果由于积分不够只能干望着,其实我们可以通过CSDN免积分下载器来免费下载我们想要的资源,这是一款不用积分,不用注册用户,不要验证码的CSDN网站资源下载工具,可轻松

Java多线程下载器FileDownloader(支持断点续传、代理等功能)

前言 在我的任务清单中,很早就有了一个文件下载器,但一直忙着没空去写.最近刚好放假,便抽了些时间完成了下文中的这个下载器. 介绍 同样的,还是先上效果图吧. Jar包地址位于 FileDownloader 目前实现的主要功能有: 多线程下载 断点续传 自定义头部等 即将完成的包括: 添加代理功能 ... 感觉做了回标题党,代理功能由于时间关系,将在下次更新加入. 关于设置代理,我这篇文章 Java实现Ip代理池 中有具体的设置方法. 另外除了这个代理功能,我也实在不知道下载器能加些啥功能了..

网站下载器WebZip、Httrack及AWWWB.COM网站克隆器

 动机 闲扯节点,可略读. 下载并试用这些软件并非是为了一己之私,模仿他人网站以图利.鉴于国内网络环境之艰苦,我等屌丝级半罐水程序员,纵有百度如诸葛大神万般协力相助,也似后主般无能不能解决工作和娱乐中的诸多困难.就那如近段时间自学Android开发为例,不说下载Android SDK费了九牛二虎之力,想看看Android官网文档,每次都想尽一切办法,使用各种手段(fg742p.exe?fg752p.exe?goagent?  看官或许笑我,何须如此费力,VPS+VPN,带你装逼带你飞,so ea

测试多线程下载的java类

多线程下载的基础类,类似于迅雷,qq旋风等下载器一样的原理 package com.shenzhen.mutiledownload2014; import java.io.InputStream; import java.io.RandomAccessFile; import java.net.HttpURLConnection; import java.net.URL; /** * 测试多线程下载的样例 * * @author mayubao * */ public class TestDow

二维码生成器和解析器-java

1.工具zxing2.1----下载地址:http://code.google.com/p/zxing/downloads/detail?name=ZXing-2.1.zip&can=2&q= 所有版本下载地址:http://code.google.com/p/zxing/downloads/list 2.需要的jar包,zxing的core.jar和zxing的javase.jar这两个jar包在zxing2.1版本中地址是 zxing/zxingorg/web/WEB-INF/lib里

用 python 实现一个多线程网页下载器

今天上来分享一下昨天实现的一个多线程网页下载器. 这是一个有着真实需求的实现,我的用途是拿它来通过 HTTP 方式向服务器提交游戏数据.把它放上来也是想大家帮忙挑刺,找找 bug,让它工作得更好. keywords:python,http,multi-threads,thread,threading,httplib,urllib,urllib2,Queue,http pool,httppool 废话少说,上源码: 1 # -*- coding:utf-8 -*- 2 import urllib,