http://www.cnblogs.com/fnng/p/3576154.html
这个是虫师的博客网站
这个知识点就是在这上面学的
我来说几个点:
1.urllib.request
查阅文档可知,python3里的方法和python2不太一样
2.编码格式问题
这样改就可以了
3.爬虫 在我看来无非就是爬取自己想要的东西
如何去选择自己想要的呢?
这里我想说 其实在下面这段代码里面最主要的是那个正则表达式
之后的爬虫最主要的也是你自己所写的正则表达式
推荐一个学习正则表达式的网址:http://www.oschina.net/question/12_9507?fromerr=wosLB4sn
完整代码 如下:
时间: 2024-10-10 07:41:20