python下载多个文件

# -*- coding: utf-8 -*-
__author__ = ‘Administrator‘
import urllib2,urllib,os,re
def Url1(url):#多个文件
    openr=urllib2.build_opener()#下载文件html代码,找出一楼的核心代码
    openr.add_handler=[(‘User-agent‘, ‘Mozilla/5.0‘)]#不加头信息则出现403错误和乱码
    html=openr.open(url).read()
    regfloor=‘<div class="msgfont">(.*?)</div>‘
    html1=re.search(regfloor,html)
    html=html1.group()
    return html.decode(‘utf-8‘)#文件保存编码和文件编辑编码都是utf-8,所以decode一次,不然会出现乱码,但是不影响结果。
def getimg(url):
    pagehtml=Url1(url)#从核心代码中照图图片地址,并且下载保存、命名
    reg=‘<img src="(.*?)" />‘#找到所有图片地址
    imag=re.findall(reg,pagehtml)
    dir=r‘G:\pic‘
    for index in xrange(len(imag)):
        pic=str(index+1)+‘.jpg‘
        fine=os.path.join(dir,pic)
        urllib.urlretrieve(imag[index],fine)
        print fine+‘ok‘

url=‘http://wangwei007.blog.51cto.com/68019/1351429‘
getimg(url)

时间: 2024-11-29 09:46:10

python下载多个文件的相关文章

[转] 三种Python下载url并保存文件的代码

原文 三种Python下载url并保存文件的代码 利用程序自己编写下载文件挺有意思的. Python中最流行的方法就是通过Http利用urllib或者urllib2模块. 当然你也可以利用ftplib从ftp站点下载文件.此外Python还提供了另外一种方法requests. 来看看三种方法是如何来下载zip文件的: import urllib import urllib2 import requests url = 'http://www.blog.pythonlibrary.org/wp-c

python 下载文件 &amp; 防盗链

偶然下载一种类型的资源,发现好多翻页,右键另存什么的,不胜其烦. 决定用python写几句代码搞定.核心代码如下: from urllib import urlretrieve from urllib import urlretrieve urlretrieve(url,save_to_path,show_download_progress) 至于url,简单的用爬虫的思路得到的.非本文的重点,不再啰嗦. 问题来了,不知道为什么,下载的所有文件都是42k! 百思不得其解,应该是某种限制,脑袋不灵

python字符集分析,解决windows下FTPClient下载中文名称文件乱码

python中的中文编码一直以来都是一个极为头大的问题,经常抛出编码转换的异常,python中的str和unicode到底是一个什么东西呢?在python中提到unicode,一般指的是unicode对象,例如'哈哈'的unicode对象为u'\u54c8\u54c8',而str,是一个字节数组,这个字节数组表示的是对unicode对象编码(可以是utf-8.gbk.cp936.GB2312)后的存储的格式.这里它仅仅是一个字节流,没有其它的含义,如果你想使这个字节流显示的内容有意义,就必须用正

python 实现endnote下载的pdf文件的整理

endnote下载的文件放在一个pdf文件夹中的一堆乱序数字的文件夹中如图 现在老板要求要把下载下来的文件发给他, 但一个个拷出来感觉有些蛋疼,于是就想到了python,通过查阅资料,完美实现了这个整理的功能,果然是python大法好2333333333333 最终效果: 本人python菜鸟,写的不好的地方,请见谅 #--------------------[classify.py]------------------ # author : zhyh2010 # date : 20150511

【331】python 下载文件:wget / urllib

参考:python下载文件的三种方法(去掉-) 方法一:wget import wget, os # 设置下载路径 os.chdir(r"D:/tmp") url="https://files.cnblogs.com/files/alex-bn-lee/ESRI_01.zip" # 获取下载文件名称 filename = wget.detect_filename(url) # 文件下载 wget.download(url) 方法二:urllib import url

Windows下python的tar.gz文件安装

windows下下载了django,PIL,web.py发现都是tar.gz格式的文件,网上查找也非常系统的方法,总结一下其他大神的方法,归纳于此. 首先下载tar.gz文件,比如web.py,下载后是一个tar.gz文件,用好压或其他解压软件解压,你会看到目录里有一个setup.py文件,这时,在地址栏输入%comspec%,这样会出现该目录下的提示符,再写Python.exe setup.py install,回车即可.(前提,环境变量已设置,否则无法使用)

python下载pps视频

简单的python下载脚本 思路 视频播放地址提取 直接解析一下原网页的源文件,利用正则就可以得到所有视频的播放地址,下面的代码以微信公共平台python教程的播放地址为例. 视频链接提取 这里利用了飞驴视频下载API进行视频链接提取,按照API的格式填写相关参数就ok了 视频下载并保存 使用urllib.urlretrieve函数保存视频就可以了 源代码 源代码贴出来,大家相互学习一下.代码比较简单,是按照上面的思路一步步做的,这里就不详细解释了 ```python !/usr/bin/env

Python下载网页的几种方法

get和post方式总结 get方式:以URL字串本身传递数据参数,在服务器端可以从'QUERY_STRING'这个变量中直接读取,效率较高,但缺乏安全性,也无法来处理复杂的数据(只能是字符串,比如在servlet/jsp中就无法处理发挥java的比如vector之类的功能). post方式:就传输方式讲参数会被打包在数据报中传输,从CONTENT_LENGTH这个环境变量中读取,便于传送较大一些的数据,同时因为不暴露数据在浏览器的地址栏中,安全性相对较高,但这样的处理效率会受到影响. get

用Python写的批量文件重命名

  有些时候下载图片或其他文件,文件名都怪怪的,可选的办法是下载一个文件批量重命名的软件.当然,如果想自己'DIY'一把的话编个Python脚本最好不过了. 下面的代码实现的对指定类型的文件进行批量重命名.拷贝下面的代码到待批量命名的文件夹下,保存为xx.py直接运行,程序会提示需要批量命名的扩展名,以及重命名时的文件前缀. # -*- coding: cp936 -*- """ Created on Wed Jun 25 16:24:23 2014 @author: Adm