urlparse模块(专门用来解析URL格式)

# -*- coding: utf-8 -*-
#python 27
#xiaodeng
#urlparse模块(专门用来解析URL格式)

#URL格式:
#protocol ://hostname[:port] / path / [;parameters][?query]#fragment
#parameters:特殊参数,一般用的很少。

#1、urlparse方法
#将url解析为6元组,返回一个ParseResult对象元组。
url=‘http://user:[email protected]:80/path;parameters?query=argument#fragment‘
import urlparse
pase=urlparse.urlparse(url)
print pase
#ParseResult(scheme=‘http‘, netloc=‘user:[email protected]:80‘, path=‘/path‘, params=‘parameters‘, query=‘query=argument‘, fragment=‘fragment‘)

#2、urlsplit方法
#返回一个SplitResult对象。如果url中没有[;parameters],建议使用urlsplit,更明确,更简洁。
pase=urlparse.urlsplit(url)
print pase
#SplitResult(scheme=‘http‘, netloc=‘user:[email protected]:80‘, path=‘/path;parameters‘, query=‘query=argument‘, fragment=‘fragment‘)

#3、获取URL属性值等方法
url=‘http://user:[email protected]:80/path?query=argument#fragment‘
pase=urlparse.urlsplit(url)
print pase.scheme#http
print pase.netloc#user:[email protected]:80
print pase.path#/path
print pase.query#query=argument
print pase.username#user
print pase.password#passwd
print pase.hostname#www.163.com
print pase.port#80
print pase.geturl()#http://user:[email protected]:80/path?query=argument#fragment

#4、urljoin,进行合并url操作,给FAQ.html添加基础URL地址
print urlparse.urljoin(‘http://www.cwi.nl/%7Eguido/Python.html‘, ‘FAQ.html‘)
#‘http://www.cwi.nl/%7Eguido/FAQ.html‘

#5、实例:
url=‘http://api.k780.com:88/?app=weather.today&weaid=1&appkey=10003&sign=b59bc3ef6191eb9f747dd4e83c99f2a4&format=xml‘
pase=urlparse.urlsplit(url)
print pase
‘‘‘
SplitResult(
scheme=‘http‘,
netloc=‘api.k780.com:88‘,
path=‘/‘,
query=‘app=weather.today&weaid=1&appkey=10003&sign=b59bc3ef6191eb9f747dd4e83c99f2a4&format=xml‘,
fragment=‘‘
)
‘‘‘
时间: 2024-10-12 17:41:52

urlparse模块(专门用来解析URL格式)的相关文章

python urlparse模块

urlparse模块主要是把url拆分为6部分,并返回元组.并且可以把拆分后的部分再组成一个url.主要有函数有urljoin.urlsplit.urlunsplit.urlparse等. urlparse.urlparse(urlstring[, scheme[, allow_fragments]]) 将urlstring解 析成6个部分,它从urlstring中取得URL,并返回元组 (scheme, netloc, path, parameters, query, fragment),但是

python 中 urlparse 模块介绍

urlparse模块主要是用于解析url中的参数  对url按照一定格式进行 拆分或拼接 1.urlparse.urlparse 将url分为6个部分,返回一个包含6个字符串项目的元组:协议.位置.路径.参数.查询.片段. import urlparse url_change = urlparse.urlparse('https://i.cnblogs.com/EditPosts.aspx?opt=1') print url_change 输出结果为: ParseResult(scheme='h

ngx lua模块源码简单解析

ngx lua模块源码简单解析分类: nginx 2014-07-11 11:45 2097人阅读 评论(0) 收藏 举报nginxlua数据结构架构目录(?)[+]对nginx lua模块的整个流程,原理简单解析.由于nginx lua模块相关配置,指令,API非常多,所以本文档只以content_by_lua指令举例说明. 读本文档最好配合读源码. 不适合对nginx和lua一点都不了解的人看.1.相关配置详细配置见 https://github.com/openresty/lua-ngin

写一个函数,尽可能高效的,从一个标准 url 里取出文件的扩展名?pathinfo文件路径& parse_url解析url & basename路径中文件名

例如: http://www.sina.com.cn/abc/de/fg.php?id=1 需要取出 php 或 .php 方案1 <?php function getExt($url){ $arr = parse_url($url); $file = basename($arr['path']); $ext = explode(".",$file); return $ext[1]; } echo getExt("http://www.sina.com.cn/abc/d

PHP的学习--解析URL

PHP中有两个方法可以用来解析URL,分别是parse_url和parse_str. parse_url 解析 URL,返回其组成部分 mixed parse_url ( string $url [, int $component = -1 ] ) 本函数解析一个 URL 并返回一个关联数组,包含在 URL 中出现的各种组成部分. 本函数不是用来验证给定 URL 的合法性的,只是将其分解为下面列出的部分.不完整的 URL 也被接受,parse_url() 会尝试尽量正确地将其解析. 参数 url

android学习二十三(解析json格式数据)

前面我们已经掌握了xml格式数据的解析方式,那么接下来我们学习下如何解析json格式的数据.比起xml,json的主要优势在于它体积更小,在网络上传输的时候可以更省流量.但缺点在于,它的语义性差,看起来不如xml直观. 开始之前,先在自己的电脑apache-tomcat-6.0.39\webapps\ROOT路径目录下新建一个get_data.json的文件,然后编辑这个文件,并加入如下json格式的内容: [{"id":"5","version"

jquery解析json格式数据的方法(对象、字符串)

相关函数 函数 描述 JSON.parse() 用于将一个 JSON 字符串转换为 JavaScript 对象. JSON.stringify() 用于将 JavaScript 值转换为 JSON 字符串. //data为字符串类型 则要将字符串类型转换成json数据类型 var jsondatas=eval("("+data+")"); 本文实例讲述了jquery解析json格式数据的方法.分享给大家供大家参考,具体如下: json数据是我们常用的一种小型的数据实

SQL 里解析 XML 格式 字段 信息

DECLARE @ItemMessage XML DECLARE @ItemTable TABLE(No NVARCHAR(300),zje NVARCHAR(300),yfje NVARCHAR(300),bcje NVARCHAR(300),URL NVARCHAR(300),Remark NVARCHAR(300)) SET @ItemMessage=N'<List> <item> <No>SM-JG-201303-0189</No> <zje&

urlparse模块(python模块)

一.urlparse模块简介 urlparse模块主要是把url拆分为6部分,并返回元组.并且可以把拆分后的部分再组成一个url.主要有函数有urljoin.urlsplit.urlunsplit.urlparse等. 二.urljoin函数使用 urljoin主要是拼接URL,它以base作为其基地址,然后与url中的相对地址相结合组成一个绝对URL地址.函数urljoin在通过为URL基地址附加新的文件名的方式来处理同一位置处的若干文件的时候格外有用.需要注意的是,如果基地址并非以字符/结尾