Python入门小练习 002 批量下载网页链接中的图片

我们常常需要下载网页上很多喜欢的图片,但是面对几十甚至上百张的图片,一个一个去另存为肯定是个很差的体验。

我们可以用urllib包获取html的源码,再以正则表达式把匹配的图片链接放入一个list中,使用for循环来依次下载list中的链接。

import re
import urllib
a = raw_input("Please input a URL: ")
s = urllib.urlopen(a)
s2 = s.read()

def image(s2):
    reg = r‘src="(.*?\.jpg)" pic_ext‘
    compile_reg = re.compile(reg)
    imagelist = re.findall(compile_reg,s2)
    temp = 0
    for x in imagelist:
            temp += 1
            urllib.urlretrieve(x,‘%s.jpg‘ % temp)
    a = "OK"
    return a
print image(s2)

urllib包参考:Python标准库 urllib

时间: 2024-09-30 14:17:44

Python入门小练习 002 批量下载网页链接中的图片的相关文章

Python 爬虫5——爬取并下载网页指定规格的图片

看完上篇文档之后,我们对于正则表达式已经有了基本的了解,其实学习最有效的办法就是带着问题和目的,这里我们假设有一个目标:获取某个网页上指定规格的图片的链接地址,并下载到本地. 一.实现步骤: 1.在浏览器中打开某个网页,例如:http://tieba.baidu.com/p/4691693167 2.假设我们要下载该页面中的几张大图,那么我们需要获取图片的url,这其实需要有两步操作来获取,一是先知道该图片的url,二是查看当前网页的html内容找到包含此url地址的格式,这样我们就能通过正则表

响应式网页设计中的图片处理

响应式网页设计,是一种正在流行的网页开发思想,它是利用灵活可变的栅格系统,令网页的显示模式可以根据访问设备的屏幕尺寸规格而进行自适应.预计2015年的时候,移动端的用户数量将会从目前的8亿,增长到19亿,而这也意味着目前我们为桌面浏览器而设计的网页,将会在他们的手机和平板上呈现出非常糟糕的使用体验. 但是随着实际应用状况的改变,响应式网页设计还是会出现一系列复杂的并发症.本文余下的部分,就是详细阐述如何在响应式网页中安置和处理多媒体元素,诸如图片和视频,最终的目的是帮你做出一个靠谱的网站,能让这

python 批量下载网页里的图片

python 3.* import requestsimport sys,re#设置提取图片url 的正则表达式imgre = re.compile(r"<img id=\"imgis\" src='(.*?)'")#存放找到的 图片url的列表all_img_urls = []#图片下载后存放位置save_path = r'/root'#获取指定网页中的图片urldef get_img_url(tmpurl,tmpre,allimgurl,timeout=1

python实现网易云音乐批量下载

今天给大家带来的是网易云音乐批量下载,代码有些粗糙,以后有时间再慢慢改进.我只爬取了某个明星的全部歌曲,如果再添加点代码完全可以爬取整站音乐,但是我认为还是点到为止,剩下的代码也不难.首先,通过网页抓包获取真实音乐文件的链接,然后找到该提交地址,并分析传入的 data .比较走运的是,网上有很多关于获取 encSecKey和 params 的教程,大家可以搜索一下. 一.抓包 我们的目的是获取到真实的 URL 地址,可以看到 post 访问该网址,可以返回真实的 URL . 二.分析 post

Python批量下载百度贴吧贴子图片

批量下载贴吧里面某个贴子的所有图片,或者只下载某一页中的图片. #!/usr/bin/env python3 import re import urllib.request class DownTiebaImg: def __init__(self, url): self.url = url def getImgLinks(self): response = urllib.request.urlopen(self.url) pattern = re.compile(r'<img class=&quo

python批量下载色影无忌和蜂鸟的图片 爬虫小应用

有些冗余信息.由于之前測试正則表達式.所以没有把它们给移走.只是不影响使用. # -*- coding:utf-8 -*- import re,urllib,sys,os,time def getAllUrl(): entry=sys.argv[1] #try: getPage=urllib.urlopen(entry).read() #except: # print "Error" pattern=re.compile(r'<a href="(.+? )".

Python入门小建议

"java从心"正式更名"KEN DO EVERTHING".Ken(Can) Do Everything,无所不能 Believe youseft then you can do everthing ! 我也是刚踏入python的大门,所以只能给点小建议,而不是指导(暂时只接触了python爬虫) 入门3部曲 1.语法学习,推荐可以看菜鸟教程上的python3语法 https://www.runoob.com/python3/python3-tutorial.ht

Freemarker入门小案例(生成静态网页的其中一种方式)

其实生成静态网页的方式有好多种,我昨天看了一下,Freemarker是其中一种,但是Freemarker现在我们都用得比较少了,现在用得ActiveMQ用来发送信息到静态页面,不过想了一下这个小东西,还是想给大家分享一下,我的小小心得. 若项目为Maven项目,那么可以如下 在Pom.xml文件里面添加 <dependency> <groupId>org.freemarker</groupId> <artifactId>freemarker</arti

python入门小程序2

1.猜年龄 age_of_princal=78 guess_age =int(input(">>:")) if guess_age == age_of_princal: print("you are right") 2.猜年龄加强版 age_of_princal=78 guess_age =int(input(">>:")) if guess_age == age_of_princal: print("you a