Python模块之urllib

  • import urllib.request,urllib.parse         # 引入模块
  • remotefile=urllib.request.urlopen(remoteaddr)  # 返回远端文件对象

remoteaddr=‘ftp://zks:%[email protected]/%s;type=i‘ %(password,filename)   # ftp密码

和文件名,也可以是http开头的网页地址

localfile=open(filename,‘wb‘).write(remotefile.read())   # 二进制模式打开本地文件并将

返回数据写入

  • urllib.request.urlretrieve(remoteaddr,filename)  # 直接从远端取回文件数据并写入本地文件
  • urllib.parse.urlparse(remoteaddr)  # 分析地址。以remoteaddr=‘http://learning-python.com/index.html‘为例,解析之后结果为ParseResult(scheme=‘http‘, netloc=‘learning-python.com‘, path=‘/index.html‘, params=‘‘, query=‘‘, fragment=‘‘)
  • urllib.parse.quote(‘C++‘)  # 将字符串‘C++‘转成url识别 ‘C%2B%2B‘
  • urllib.request.urlretrieve(remoteaddr,filename)  # 直接从远端取回文件数据并写入本地文件
  • urllib.request.urlretrieve(remoteaddr,filename)  # 直接从远端取回文件数据并写入本地文件
  • urllib.request.urlretrieve(remoteaddr,filename)  # 直接从远端取回文件数据并写入本地文件
  • urllib.request.urlretrieve(remoteaddr,filename)  # 直接从远端取回文件数据并写入本地文件
时间: 2024-10-10 22:57:44

Python模块之urllib的相关文章

python模块学习——urllib模块

参考学习:http://www.blogjava.net/ashutc/archive/2011/03/21/346695.html 1.urllib.quote()函数 模拟登录时,对用户名进行处理: 1 def GetUserName(userName): 2 userNameTemp = urllib.quote(userName) 3 userNameEncoded = base64.encodestring(userNameTemp)[:-1] 4 return userNameEnc

python实现简单爬虫(二)---- 使用urllib等python模块

之前使用scrapy实现了一个超级简单的爬虫工具,用于抓取豆瓣上面所有的编程书籍信息(由于不需要爬取整个页面的所以链接,所以不需要用到BFS or DFS,只实现顺序抓取下一页) 这次使用的是python自带的urllib 和urllib2等python模块实现,同样以豆瓣上面的爱情电影信息作为爬取对象,方法与过程其实如出一辙,同样是对每一个页面发出请求后获取响应得到的网页源码,再使用正则表达式去匹配获得所需信息,然后获取下一页的链接继续爬取. 爬取页面: 网页源码: title and lin

python网络入门:urllib.request模块和urllib.urllib.parse模块

************************************************* ** 转发请注明原文,尊重原创 ** 原文来自:blog.csdn.net/clark_xu 徐长亮的专栏 ************************************************* 1 urllib.parse模块 Urllib.parse模块在urllib package中 引入 >>> from urllib import parse Urllib.parse

python模块。

全局变量 全局变量 python在一个.py文件内部自动添加了一些全局变量 print(vars()) #查看当前的全局变量 执行结果: {'__package__': None, '__loader__': <_frozen_importlib_external.SourceFileLoader object at 0x01035A70>, '__cached__': None, '__name__': '__main__', '__spec__': None, '__builtins__'

python模块之HTMLParser抓页面上的所有URL链接

# -*- coding: utf-8 -*- #python 27 #xiaodeng #python模块之HTMLParser抓页面上的所有URL链接 import urllib #MyParser类写法一 ''' from HTMLParser import HTMLParser class MyParser(HTMLParser): def __init__(self): HTMLParser.__init__(self) def handle_starttag(self, tag, a

Python网络请求urllib和urllib3详解

Python网络请求urllib和urllib3详解 urllib是Python中请求url连接的官方标准库,在Python2中主要为urllib和urllib2,在Python3中整合成了urllib. 而urllib3则是增加了连接池等功能,两者互相都有补充的部分. urllib urllib作为Python的标准库,基本上涵盖了基础的网络请求功能. urllib.request urllib中,request这个模块主要负责构造和发起网络请求,并在其中加入Headers.Proxy等. 发

python模块自学

随python附带安装的有python标准库,标准库中有很多模块,一般常见的任务都可以由指定的模块来直接实现,python标准库包含的模块有上百个之多,如__builtin__模块(这个模块包含 Python 中使用的内建函数,一般不用手动导入这个模块,Python会帮你做好一切).os模块.re模块.math模块.sys模块.copy模块.time模块.threading模块.urllib模块等等,还有一些其他线程和进程.网络协议等等各种模块,这里来说一下独立的探索这些模块的方法. pytho

python-学习笔记之-Day5 双层装饰器 字符串格式化 python模块 递归 生成器 迭代器 序列化

1.双层装饰器 #!/usr/bin/env python # -*- coding: utf-8 -*- # author:zml LOGIN_INFO = False IS_ADMIN = False   def check_log(func): def inner(): res = func() if LOGIN_INFO: print('验证成功!') return res else: print('验证失败!') return inner   def check_admin(func)

Python模块的交叉引用问题分析

实际项目中遇到python模块相互引用问题,查资料,说是通过import局部导入的方式可以避免错误,资料如附录所述. 但更改后测试还是会出错,很疑惑!? 如果哪位读者有好的解决方法,敬请留言说明,谢谢. 所以,最好的方法是不进行交叉引用,如果需要就单独分一个模块出来. 附录:Python模块的交叉引用问题解读:How can I have modules that mutually import each other? 有下面两个文件相互引用,Python解释器报错. foo.py: from