一直以来都想好好学习Python,但是每次学习了从基础感觉学了一会就感觉没意思。今天学习一下爬虫,也算是自己学python的目的吧,但是在学习过程中遇到很多困难,但幸好遇到了一篇好博文,分享给大家:http://www.cnblogs.com/fnng/p/3576154.html
源码:
#encoding : utf-8 import urllib import re def getHtml(url): page = urllib.urlopen(url) html =page.read() return html def getImg(html): reg = r‘src="(.+?\.jpg)" size‘ imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,‘%s.jpg‘ %x) x+= 1 html = getHtml("https://tieba.baidu.com/p/5154456009") print getImg(html)
时间: 2024-10-27 19:51:40