前言 ,想利用小程序导航页面来提升网站的流量,找到 www.xcxdh666.com 该小程序导航网站。
分析网页
1 发现网站其实也是用异步分页请求加载数据的 ,所以根本用不着xpath 解析html,直接分析其请求url
2点击加载更多找到请求,发现其实就 pageNum ,cagegory 两个参数
3所以直接请求url 带入参数,分析起返回json结果
编写代码
1 首先建立接收类型
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |
|
2 封装请求页面方法
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 |
|
3 图片url处理 思路就是要将其返回的url 请求下载到本地或者上传到自己对应的图片服务器,
我这里是用七牛云存储img的 ,这里你可以改成下载到本地 返回本地的url就好。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 |
|
4 最后是请求主体方法
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 |
|
ok 到这里就全部抓取完成
这里附上 展示地址 http://siyouku.cn/Applet