我们的学习爬虫的动力是什么?
有人可能会说:如果我学好了,我可以找一个高薪的工作。
有人可能会说:我学习编程希望能够为社会做贡献(手动滑稽)
有人可能会说:为了妹子!
.....
其实我们会发现妹子才是第一生产力呀!
今天咱们就是爬取今日头条,你要问我为什么要爬取今日头条?是因为爱嘛?
是因为责任嘛?
不,是因为头条里面的有很多美女图片,然后我们可以把她们都爬取下来!!!
是不是想想都觉得很兴奋,是不是都要流鼻血了?!
我们要做的就是把上面的图片给爬下来。
开始分析网站
按下f12,然后点击network,刷新下你可以看到这些
在网页上可以看到图片会随着你下拉网页而进行显示更多的图片。
今日头条的网站是动态加载的,其实可以很轻松的就可以在xhr的文件里面找到。
不断地发送请求,点击这个请求看看是返回什么数据
可以看到这是个json,里面有图片的url,这个就是我们要找的东西。
我们可以用json库来解析,还有这个网站是get请求,这样就可以用requests库来发送然后解析下就可以了,非常简单。
代码:需要完整的代码关注转发,加我QQ群:836962007 即可获取!
最后给你们看下结果
上述文章如有错误欢迎在留言区指出,如果这篇文章对你有用,点个赞,转个发如何?
好了给大家送上这一篇文的福利 加我QQ群:836962007即可获取哦!
原文地址:http://blog.51cto.com/13908663/2156298
时间: 2024-11-12 03:09:23