JAVA刷CSDN博客流量的思路

先来看看CSDN统计博客访问量的原理:

当客户端向服务器发起请求的时候,每个ip被统计一次,上图的三个客户端指的是三个不同的ip地址。并且在某段时间内,同以ip访问同一篇文章,只能算是一次访问量。同一ip在某个时间段内访问同一博客不同的文章,被访问到的文章次数+1。知道上诉简单的原理之后,接下来就想解决的办法了。

首先,准备一大批ip代理。一百度,嚯出来一大堆啊,这个年代雷锋还是挺多的,我选择了这家ip代理网站,并提供了api的调用接口,调用地址是:

http://www.xicidaili.com/api。

其次,引入我们需要的jar包,这里只需要一个jsoup包,千万别被jsoup这个名词吓到,下面我会贴出我的博客,说说这个哥们干嘛用的。

  1. jsoup-1.8.1.jar

接下来写一个封装ip类的java bean,其实不写bean也可以,直接放在String[]数组里面也是ok的,不过这样做的时候,代理调用的时候方便取出。

public class MyIp {

    private String address;

    private String port;

    public String getAddress() {
        return address;
    }

    public void setAddress(String address) {
        this.address = address;
    }

    public String getPort() {
        return port;
    }

    public void setPort(String port) {
        this.port = port;
    }
}

  现在主要用到的调用这个接口的工具是:jsoup,这个哥们我推荐看我的博客http://blog.csdn.net/zhang5476499/article/details/52205150。当然你也可以用httpClient等工具把网页的内容拿下来。用java 代码实现如下:

public static List<MyIp> getIp(String url) {
        List<MyIp> ipList = null;
        try {
            //1.向ip代理地址发起get请求,拿到代理的ip
            Document doc = Jsoup.connect(url)
              .userAgent("Mozilla")
              .cookie("auth", "token")
              .timeout(3000)
              .get();

            //2,将得到的ip地址解析除字符串
            String ipStr = doc.body().text().trim().toString();

            //3.用正则表达式去切割所有的ip
            String[] ips = ipStr.split("\\s+");

            //4.循环遍历得到的ip字符串,封装成MyIp的bean
            ipList = new ArrayList<MyIp>();
            for(final String ip : ips) {
                MyIp myIp = new MyIp();
                String[] temp = ip.split(":");
                myIp.setAddress(temp[0].trim());
                myIp.setPort(temp[1].trim());
                ipList.add(myIp);
            }
        } catch (IOException e) {
            System.out.println("加载文档出粗");
        }
        return ipList;
    }

  这里需要注意的是,api调用这个页面的 时候,使用的是get请求。好了,假设已经拿到了api给的100个代理的ip,那么,我们就可以设置代理了,设置代理的主要代码如下:

System.setProperty("http.maxRedirects", "50");
System.getProperties().setProperty("proxySet", "true");
System.getProperties().setProperty("http.proxyHost", myIp.getAddress());
System.getProperties().setProperty("http.proxyPort", myIp.getPort());

  下一步的工作是:循环这些拿到的代理ip,每设置一次代理,向博客地址发一次请求。

 1 public static void main(String[] args) {
 2         //1.想http代理地址api发起请求,获得想要的代理ip地址
 3         String url = "http://api.xicidaili.com/free2016.txt";
 4         List<MyIp> ipList = getIp(url);
 5         String blogUrl = "";
 6         Scanner sc = new Scanner(System.in);
 7
 8         System.out.print("请输入文章地址:");
 9         blogUrl = sc.nextLine();
10         System.out.print("请输入轮番刷新的倍数(x100):");
11         int time = sc.nextInt();
12         int count = 0;
13
14         for(int i = 0; i< time; i++) {
15             //2.设置ip代理
16             for(final MyIp myIp : ipList) {
17                 System.setProperty("http.maxRedirects", "50");
18                 System.getProperties().setProperty("proxySet", "true");
19                 System.getProperties().setProperty("http.proxyHost", myIp.getAddress());
20                 System.getProperties().setProperty("http.proxyPort", myIp.getPort());
21
22                 try {
23                     Document doc = Jsoup.connect(blogUrl)
24                                       .userAgent("Mozilla")
25                                       .cookie("auth", "token")
26                                       .timeout(3000)
27                                       .get();
28                     if(doc != null) {
29                         count++;
30                         logger.info("成功刷新次数: " + count);
31                     }
32                 } catch (IOException e) {
33                     logger.error(myIp.getAddress() + ":" + myIp.getPort() + "报错");
34                 }
35             }
36         }
37     }

代理写到这差不多就结束了,其实刷流量也不需要多高深的技术,本文只是一个引子,希望能够祈祷抛砖引玉的作用。相关代码地址:http://download.csdn.net/detail/zhang5476499/9687448

--2016.11.27 14:08:30

时间: 2024-11-05 16:04:50

JAVA刷CSDN博客流量的思路的相关文章

如何统计分析CSDN博客流量

第一.IP.PV和UV分别是什么意思? IP,实际上也就是指独立IP,它的英文为Internet ***otocol,是独立IP数的意思.00:00-24:00相同IP地址记录一次.即使你有多台电脑,但是如果IP地址是一样的,那么也只能算是一个IP的访问,IP数据依然为1. PV,也就是指访问量,它的英文是Page View,具体是指网站的是页面浏览量或者点击量,页面被刷新一次就计算一次.如果网站被刷新了1000次,那么流量统计工具显示的PV就是1000 . UV,它是独立访客的意思,英文为Un

怎样统计分析CSDN博客流量

第一.IP.PV和UV各自是什么意思? IP.实际上也就是指独立IP,它的英文为Internet ***otocol,是独立IP数的意思.00:00-24:00同样IP地址记录一次.即使你有多台电脑.可是假设IP地址是一样的,那么也仅仅能算是一个IP的訪问,IP数据依旧为1. PV,也就是指訪问量,它的英文是Page View.详细是指站点的是页面浏览量或者点击量.页面被刷新一次就计算一次. 假设站点被刷新了1000次,那么流量统计工具显示的PV就是1000 . UV,它是独立訪客的意思,英文为

Python爬取CSDN博客文章

之前解析出问题,刚刚看到,这次仔细审查了 0 url :http://blog.csdn.net/youyou1543724847/article/details/52818339Redis一点基础的东西目录 1.基础底层数据结构 2.windows下环境搭建 3.java里连接redis数据库 4.关于认证 5.redis高级功能总结1.基础底层数据结构1.1.简单动态字符串SDS定义: ...47分钟前1 url :http://blog.csdn.net/youyou1543724847/

[搬运自我的CSDN博客] python抓取javascript动态生成HTML内容的实践

<注:CSDN博客在美国访问特别卡,所以转移到cnblogs来发文章> 本实验在Ubuntu14.04上完成.使用的浏览器是火狐(Firefox 33.0),python版本是2.7.6. 大家都知道用urllib配合正则表达式抓取静态HTML的内容很方便,但是如果网页中有javascript动态生成的内容,urllib就无能为力了. 此时我们要借助一个额外的工具:selenium.它的工作原理是操纵(火狐)浏览器浏览目标网页,等待网页中的javascript全部执行完毕后再对HTML源码进行

Android应用开发-小巫CSDN博客客户端之显示博文详细内容

Android应用开发-小巫CSDN博客客户端之显示博文详细内容 上篇博文给大家介绍的是如何嵌入有米广告并且获取收益,本篇博客打算讲讲关于如何在一个ListView里显示博文的详细信息,这个可能是童鞋们比较困惑的,因为一篇博客可能有标题.摘要.图片.代码等等元素组成,我们要怎么在一个界面中显示这些内容并且按照自己的指定的方式显示呢,别急,下面会告诉大家. 重新整理一下一篇博文可能有以下元素: 标题 摘要 文本内容 图片 粗标题 代码块 在UI篇小巫已经介绍了,博文详细内容的主要控件就是一个Lis

Android应用开发-小巫CSDN博客客户端Jsoup篇

Android应用开发-小巫CSDN博客客户端Jsoup篇 距上一篇博客已经过去了两个星期,小巫也觉得非常抱歉,因为在忙着做另外一个项目,几乎抽不出空来,这不小巫会把剩下的博文全部在国庆补上.本篇博客将会给大家介绍如何使用Jsoup这个库来解析我们的网页,并且如何对我们想解析的网页进行分析. Jsoup这个库的下载地址:http://jsoup.org/download 笔者这里使用的jsoup-1.7.2 下载完之后复制到项目中的libs目录下即可: Jsoup的资料比较少,可供参考的可到其官

【转】Android Building System 总结 - 一醉千年 - CSDN博客

原文网址:http://www.360doc.com/content/15/0314/23/1709014_455175716.shtml Android Building System 总结 收藏 花了一个月的时间来看Android Make,在网上总是看到某某大虾说一天就把Android Make overview了一下,不得不感叹现在大虾的强大和咱那连蜗牛都可以鄙视一下的进度.不过总算是彻底看清的Android make这个系统,不得不当初架构出这套机制的神人顶礼膜拜一下,虔诚地烧三柱高香

CSDN博客自动访问

声明:本代码仅供学习娱乐. 1.采用线程访问 2.使用线程池和阻塞队列 <span style="font-size:18px;">import java.net.HttpURLConnection; import java.net.URI; import java.net.URLConnection; import java.util.concurrent.ArrayBlockingQueue; import java.util.concurrent.BlockingQu

Android应用开发-小巫CSDN博客客户端开发开篇

Android应用开发-小巫CSDN博客客户端开发开篇 2014年9月8日 八月十五 祝各位中秋节快乐 小巫断断续续花了几个星期的时间开发了这么一款应用--小巫CSDN博客,属于私人定制的这样的一款应用,整个客户端的数据全部来自本人博客,是通过爬取本人博客地址html页面,然后解析html把数据提取出来,整个客户端的技术难点主要是如何对html界面进行分析和使用Jsoup对html代码进行解析.目前本人的这款应用已经开发出来了,近段时间会提交应用商店进行审核,不久大家就可以看到这么一款逼格满满的