欢迎大侠们指正批评
思路:
1、引入相关的python文件(import re import urllib)
2、读取对应网页的html文件(使用 urllib)
def getHtml(url): page = urllib.urlopen(url) html = page.read() print html return html
3、在读取的html文件中使用正则表达式匹配图片路径并保存图片
def getimage(date): imgR = r‘src="(.*?\.jpg)"‘ cimgR = re.compile(imgR) imageList = cimgR.findall(date) x = 0 for image in imageList: urllib.urlretrieve(image,"%s.jpg"% x) x = x +1 return imageList[1]html = getHtml("https://tieba.baidu.com/p/5608328332")
原文地址:https://www.cnblogs.com/sunnyJia/p/8620616.html
时间: 2024-10-10 17:18:50