urlparse 模块

urlpasrse 模块提供了操作 URL 字符串的基本功能。这些功能包括 urlparse(), urlunparse()和 urljoin().

urlparse()将 URL 字符串拆分成如上所描述的一些主要部件。语法结构如下:
urlparse(urlstr, defProtSch=None, allowFrag=None)

from urllib.parse import urlparse

>>>urlparse(‘http://www.python.org/doc/FAQ.html‘)
(‘http‘, ‘www.python.org‘, ‘/doc/FAQ.html‘, ‘‘, ‘‘, ‘‘)

urlunparse()的功能与 urlpase()完全相反—它拼合一个 6-元组(prot_sch, net_loc, path,
params, query, frag)- urltup,它可能是一个 URL 经 urlparse()后的输出返回值。于是,我们可
以用如下方式表示:
urlunparse(urlparse(urlstr)) = urlstr

urljoin:

在需要多个相关的 URL 时我们就需要使用 urljoin()的功能了,如,在一个 Web 页中生成的一系
列页面的 URL。Urljoin()的语法是:
urljoin(baseurl, newurl, allowFrag=None)

将 URL 的基部件 baseurl 和 newurl 拼合成一个完整的 URL;allowFrag 的作用和 urlpase()中相同。

>>> urlparse.urljoin(‘http://www.python.org/doc/FAQ.html‘, ... ‘current/lib/lib.htm‘)

‘http://www.python.org/doc/current/lib/lib.html‘

时间: 2024-08-25 23:30:58

urlparse 模块的相关文章

python urlparse模块

urlparse模块主要是把url拆分为6部分,并返回元组.并且可以把拆分后的部分再组成一个url.主要有函数有urljoin.urlsplit.urlunsplit.urlparse等. urlparse.urlparse(urlstring[, scheme[, allow_fragments]]) 将urlstring解 析成6个部分,它从urlstring中取得URL,并返回元组 (scheme, netloc, path, parameters, query, fragment),但是

urlparse模块(专门用来解析URL格式)

# -*- coding: utf-8 -*- #python 27 #xiaodeng #urlparse模块(专门用来解析URL格式) #URL格式: #protocol ://hostname[:port] / path / [;parameters][?query]#fragment #parameters:特殊参数,一般用的很少. #1.urlparse方法 #将url解析为6元组,返回一个ParseResult对象元组. url='http://user:[email protect

urlparse模块(python模块)

一.urlparse模块简介 urlparse模块主要是把url拆分为6部分,并返回元组.并且可以把拆分后的部分再组成一个url.主要有函数有urljoin.urlsplit.urlunsplit.urlparse等. 二.urljoin函数使用 urljoin主要是拼接URL,它以base作为其基地址,然后与url中的相对地址相结合组成一个绝对URL地址.函数urljoin在通过为URL基地址附加新的文件名的方式来处理同一位置处的若干文件的时候格外有用.需要注意的是,如果基地址并非以字符/结尾

python 中 urlparse 模块介绍

urlparse模块主要是用于解析url中的参数  对url按照一定格式进行 拆分或拼接 1.urlparse.urlparse 将url分为6个部分,返回一个包含6个字符串项目的元组:协议.位置.路径.参数.查询.片段. import urlparse url_change = urlparse.urlparse('https://i.cnblogs.com/EditPosts.aspx?opt=1') print url_change 输出结果为: ParseResult(scheme='h

urlparse模块

urlparse -- 解析(绝对和相对)URL 函数:    parse_qs(qs, keep_blank_values=0, strict_parsing=0)        解析一个查询字符串        qs: 要被解析的由%编码的查询字符串        keep_blank_values: 标识查询字符串中空值是否应该看出空字符串,默认为False,直接忽略        strict_parsing:标识解析错误时做什么.默认为False忽略错误,True则抛出ValueErr

python urlparse模块的实用手册

#!/usr/bin/env python # -*- coding: utf-8 -*- import urlparse cve = 'CVE-2012-2143' path = '/' + cve + '.html' cveUrl = "http://cve.scap.org.cn/CVE-2015-2976.html"    #URL parsedUrl = urlparse.urlparse(cveUrl)                   #解构为tuple元组 print

python之web模块学习-- urlparse

继续学习python的web模块,urlparse 是一个比较简单的模块,主要是用来 解析URL字符串的 1  urlparse简介 python使用urlparse来解析URL字符串 主要方法: urlprase 次要方法: urljoin urlsplit  urlunsplit等 2  urlparse详解 urlparse模块主要是把url拆分为6部分,并返回元组.并且可以把拆分后的部分再组成一个url.主要有函数有urljoin.urlsplit.urlunsplit.urlparse

python 常用模块及方法

******************** PY核心模块方法 ******************** os模块: os.remove()         删除文件 os.unlink()         删除文件 os.rename()         重命名文件 os.listdir()        列出指定目录下所有文件 os.chdir()          改变当前工作目录 os.getcwd()         获取当前文件路径 os.mkdir()          新建目录 os

python 各模块

01 关于本书 02 代码约定 03 关于例子 04 如何联系我们 1 核心模块 11 介绍 111 内建函数和异常 112 操作系统接口模块 113 类型支持模块 114 正则表达式 115 语言支持模块 12 _ _builtin_ _ 模块 121 使用元组或字典中的参数调用函数 1211 Example 1-1 使用 apply 函数 1212 Example 1-2 使用 apply 函数传递关键字参数 1213 Example 1-3 使用 apply 函数调用基类的构造函数 122