python下载多个文件

# -*- coding: utf-8 -*-
__author__ = ‘Administrator‘
import urllib2,urllib,os,re
def Url1(url):#多个文件
    openr=urllib2.build_opener()#下载文件html代码，找出一楼的核心代码
    openr.add_handler=[(‘User-agent‘, ‘Mozilla/5.0‘)]#不加头信息则出现403错误和乱码
    html=openr.open(url).read()
    regfloor=‘<div class="msgfont">(.*?)</div>‘
    html1=re.search(regfloor,html)
    html=html1.group()
    return html.decode(‘utf-8‘)#文件保存编码和文件编辑编码都是utf-8，所以decode一次，不然会出现乱码，但是不影响结果。
def getimg(url):
    pagehtml=Url1(url)#从核心代码中照图图片地址，并且下载保存、命名
    reg=‘<img src="(.*?)" />‘#找到所有图片地址
    imag=re.findall(reg,pagehtml)
    dir=r‘G:\pic‘
    for index in xrange(len(imag)):
        pic=str(index+1)+‘.jpg‘
        fine=os.path.join(dir,pic)
        urllib.urlretrieve(imag[index],fine)
        print fine+‘ok‘

url=‘http://wangwei007.blog.51cto.com/68019/1351429‘
getimg(url)

时间： 2024-11-29 09:46:10

python下载多个文件的相关文章

[转] 三种Python下载url并保存文件的代码

原文三种Python下载url并保存文件的代码利用程序自己编写下载文件挺有意思的. Python中最流行的方法就是通过Http利用urllib或者urllib2模块. 当然你也可以利用ftplib从ftp站点下载文件.此外Python还提供了另外一种方法requests. 来看看三种方法是如何来下载zip文件的: import urllib import urllib2 import requests url = 'http://www.blog.pythonlibrary.org/wp-c

python 下载文件 & 防盗链

偶然下载一种类型的资源,发现好多翻页,右键另存什么的,不胜其烦. 决定用python写几句代码搞定.核心代码如下: from urllib import urlretrieve from urllib import urlretrieve urlretrieve(url,save_to_path,show_download_progress) 至于url,简单的用爬虫的思路得到的.非本文的重点,不再啰嗦. 问题来了,不知道为什么,下载的所有文件都是42k! 百思不得其解,应该是某种限制,脑袋不灵

python字符集分析,解决windows下FTPClient下载中文名称文件乱码

python中的中文编码一直以来都是一个极为头大的问题,经常抛出编码转换的异常,python中的str和unicode到底是一个什么东西呢?在python中提到unicode,一般指的是unicode对象,例如'哈哈'的unicode对象为u'\u54c8\u54c8',而str,是一个字节数组,这个字节数组表示的是对unicode对象编码(可以是utf-8.gbk.cp936.GB2312)后的存储的格式.这里它仅仅是一个字节流,没有其它的含义,如果你想使这个字节流显示的内容有意义,就必须用正

python 实现endnote下载的pdf文件的整理

endnote下载的文件放在一个pdf文件夹中的一堆乱序数字的文件夹中如图现在老板要求要把下载下来的文件发给他, 但一个个拷出来感觉有些蛋疼,于是就想到了python,通过查阅资料,完美实现了这个整理的功能,果然是python大法好2333333333333 最终效果: 本人python菜鸟,写的不好的地方,请见谅 #--------------------[classify.py]------------------ # author : zhyh2010 # date : 20150511

【331】python 下载文件：wget / urllib

参考:python下载文件的三种方法(去掉-) 方法一:wget import wget, os # 设置下载路径 os.chdir(r"D:/tmp") url="https://files.cnblogs.com/files/alex-bn-lee/ESRI_01.zip" # 获取下载文件名称 filename = wget.detect_filename(url) # 文件下载 wget.download(url) 方法二:urllib import url

Windows下python的tar.gz文件安装

windows下下载了django,PIL,web.py发现都是tar.gz格式的文件,网上查找也非常系统的方法,总结一下其他大神的方法,归纳于此. 首先下载tar.gz文件,比如web.py,下载后是一个tar.gz文件,用好压或其他解压软件解压,你会看到目录里有一个setup.py文件,这时,在地址栏输入%comspec%,这样会出现该目录下的提示符,再写Python.exe setup.py install,回车即可.(前提,环境变量已设置,否则无法使用)

python下载pps视频

简单的python下载脚本思路视频播放地址提取直接解析一下原网页的源文件,利用正则就可以得到所有视频的播放地址,下面的代码以微信公共平台python教程的播放地址为例. 视频链接提取这里利用了飞驴视频下载API进行视频链接提取,按照API的格式填写相关参数就ok了视频下载并保存使用urllib.urlretrieve函数保存视频就可以了源代码源代码贴出来,大家相互学习一下.代码比较简单,是按照上面的思路一步步做的,这里就不详细解释了 ```python !/usr/bin/env

Python下载网页的几种方法

get和post方式总结 get方式:以URL字串本身传递数据参数,在服务器端可以从'QUERY_STRING'这个变量中直接读取,效率较高,但缺乏安全性,也无法来处理复杂的数据(只能是字符串,比如在servlet/jsp中就无法处理发挥java的比如vector之类的功能). post方式:就传输方式讲参数会被打包在数据报中传输,从CONTENT_LENGTH这个环境变量中读取,便于传送较大一些的数据,同时因为不暴露数据在浏览器的地址栏中,安全性相对较高,但这样的处理效率会受到影响. get

用Python写的批量文件重命名

有些时候下载图片或其他文件,文件名都怪怪的,可选的办法是下载一个文件批量重命名的软件.当然,如果想自己'DIY'一把的话编个Python脚本最好不过了. 下面的代码实现的对指定类型的文件进行批量重命名.拷贝下面的代码到待批量命名的文件夹下,保存为xx.py直接运行,程序会提示需要批量命名的扩展名,以及重命名时的文件前缀. # -*- coding: cp936 -*- """ Created on Wed Jun 25 16:24:23 2014 @author: Adm

猜你喜欢

Linux基础之磁盘及文件系统管理（二）

磁盘和文件系统管理文件系统管理工具: 创建文件系统的工具 mkfs mkfs.ext2, mkfs.ext3, mkfs.ext4, mkfs.xfs, mkfs.vfat, ... 检测及修复文件 ...

使用OpenSSL 自建CA 以及颁发证书

OpenSSL是套开放源代码的软件库包,实现了SSL与TLS协议.其主要库是以C语言所写成,实现了基本的加密功能. OpenSSL可以运行在绝大多数类Unix操作系统上(包括Solaris,Linux ...

discuz注册页修改

大家好!近来备受发帖机困扰,备受垃圾帖子困扰.一直以来都纯粹在删帖当中,本来网站服务器就是国内服务器,这样一来很多关键字是禁止的,可不管如何设置防灌水还是无法杜绝这一事项,特别是国内空间的网站,一出现 ...

微积分和概率论

微积分和概率论作者:樱花猪摘要: 本文为七月算法(julyedu.com)12月机器学习第一次课在线笔记.本次课以机器学习的观点来看待曾经学过的数学问题,为未来的做机器学习的公式推导做理论基础.主 ...

wpf 修改控件Background

以TextBox 控件为例一 Brushes.颜色 textBoxName.Background = Brushes.Blue; 二背景色值#FFD2D2D2 1 .textBoxName.Ba ...

【路线篇（二）】知识点归纳

[喵"的Android之路][路线篇(二)]知识点归纳参考:http://blog.csdn.net/xujing81/article/details/7313507 第一阶段:Java面 ...

防火墙没关导致 ORA-12541: TNS: 无监听程序

电脑用着用着突然Oracle就报出下面的错误,按照网上的办法搞了几个小时都没有搞好. Oracle重装了好几次也没用,实在没办法又花了个多小时装了个虚机,结果也是同样的错误. 于是恍然大悟,可能是物理 ...

【C#】ADO .Net Entities Framework使用查询语句时遇到的错误

XAML代码: <Window x:Class="WpfApplication72.MainWindow" xmlns="http://schemas.micros ...

【转】block强弱引用

原地址:Block内的强引用众所周知,当某个对象持有着一个Block的时候,如果在Block内部使用强引用反过来持有这个对象,就会导致引用循环.为了避免引用循环,可以使用__weak修饰符,苹果的官 ...

curl post

$vars['access_token'] =$token; $vars['status'] = $r['content']; $method_post = true;//登录提交的url地址(表单中 ...

HDU4588 找规律

附上题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4588 题目意思是a + a+1 + a+2 .. + b-1 + b, 的二进制加法中总共发 ...

websocket实例(显示文件导入处理进度)

大批量数据导入时,需要即时显示对文件的处理进度.考虑ajax轮询太浪费资源,使用websocket实现. 项目使用Spring MVC(3.1),与websocket结合要求版本4.0以上.所以没有使 ...

ASPCMS 多条件查询

1. 表单样例: <form name="topFrm" id="topFrm" action="/search.asp"> & ...

主攻ASP.NET.4.5.1 MVC5.0之重生:政府行政网站常用友情链接跳转javascript[干货分享]

<script language="JavaScript" type="t ...

Objective-C 观察者模式--KVO和NSNotificationCenter的使用

Objective-C中的KVO和NSNotificationCenter的原理是观察模式的很好实现, 下面用代码分别演示下用法 KVO的用法 1 - (void)viewDidLoad { 2 [s ...

在功能上，坚果云是处于领先地位的

拼空间大小,坚果云拼不过大公司.但是在功能上,坚果云是处于领先地位的. 1. 全平台覆盖,大公司网盘有做到的吗?快盘有 Linux 版,还有么2. WebDAV,据我有限的所知,国内唯一3. 谷歌二次 ...

[英语学习]儿童英语 sesamestreet

最近在和我的孩子学习汉语,用在自己学习英语方面,就是多看小故事,多看儿歌. 以前孙小小分享过这个网站www.sesamestreet.org 现在找出来看看,还是很不错的. 搜索elbows and ...

Powershell RESTAPI 访问Office365

豆子之前对Office365的用户操作一般是通过远程的加载模块,然后创建一个session连接. 比如 $cred = Get-Credential Import-Module MSOnline S ...

php 字符串大小写转换

strtoupper().strtolower().ucfirst().ucfirst().ucwords().mb_strtoupper().mb_strtolower()和mb_convert_c ...

POJ 1463 Strategic game 最小点覆盖集（树形dp）

点击打开链接 Strategic game Time Limit: 2000MS Memory Limit: 10000K Total Submissions: 6105 Accepted: ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.021 s.