urlparse模块(python模块)

一、urlparse模块简介

urlparse模块主要是把url拆分为6部分,并返回元组。并且可以把拆分后的部分再组成一个url。主要有函数有urljoin、urlsplit、urlunsplit、urlparse等。

二、urljoin函数使用

urljoin主要是拼接URL,它以base作为其基地址,然后与url中的相对地址相结合组成一个绝对URL地址。函数urljoin在通过为URL基地址附加新的文件名的方式来处理同一位置处的若干文件的时候格外有用。需要注意的是,如果基地址并非以字符/结尾的话,那么URL基地址最右边部分就会被这个相对路径所替换。如果希望在该路径中保留末端目录,应确保URL基地址以字符/结尾。


输入代码:

import urlparse

#urljoin函数是合并域名和相对路径的
urljoin = urlparse.urljoin(‘http://www.sina.cn/cc‘,‘file/down.php‘)
print urljoin

urljoin1 = urlparse.urljoin(‘http://www.sina.cn/cc/‘,‘file/down.php‘)
print urljoin1

代码运行结果:

C:\Python27\python.exe C:/Users/Lee/Desktop/d/PycharmProjects/untitled/test.py

http://www.sina.cn/file/down.php

http://www.sina.cn/cc/file/down.php

三、urlparse函数和urlsplit函数使用

主要是分析urlstring,返回一个包含5个字符串项目的元组:协议、位置、路径、查询、片段。allow_fragments为False时,该元组的组后一个项目总是空,不管urlstring有没有片段,省略项目的也是空。urlsplit()和urlparse()差不多


输入代码:

import urlparse

url = ‘http://www.baidu.com/good/index.php?id=18‘

#urlsplit函数是把一个url查分出对应部分result = urlparse.urlsplit(url)print result#显示协议print result.scheme#显示域名print result.netloc#显示相对路径print result.path#显示查询参数print result.query

代码运行结果:

C:\Python27\python.exe C:/Users/Lee/Desktop/d/PycharmProjects/untitled/test.py

SplitResult(scheme=‘http‘, netloc=‘www.baidu.com‘, path=‘/good/index.php‘, query=‘id=18‘, fragment=‘‘)

http

www.baidu.com

/good/index.php

id=18

时间: 2024-10-05 05:44:27

urlparse模块(python模块)的相关文章

python-学习笔记之-Day5 双层装饰器 字符串格式化 python模块 递归 生成器 迭代器 序列化

1.双层装饰器 #!/usr/bin/env python # -*- coding: utf-8 -*- # author:zml LOGIN_INFO = False IS_ADMIN = False   def check_log(func): def inner(): res = func() if LOGIN_INFO: print('验证成功!') return res else: print('验证失败!') return inner   def check_admin(func)

七、Python模块和包

Python模块 Python模块是组织代码的基本方式 Python的脚本都是用扩展名为py的文本文件保存的,一个脚本可以单独运行,也可以导入另一个脚本中运行.当脚本被导入运行时,将其称为模块 cat test.py #!/usr/bin/python #coding:utf-8 from __future__ import division def a(x,y): print x+y def b(x,y): print x*y cat new.py #!/usr/bin/python impo

Python学习日志之Python模块

Python入门学习笔记之Python模块 Python模块: 一.认识Python模块 1.什么是模块 函数是可以实现一项或多项功能的一段程序.我们的模块是函数功能的扩展,模块是可以实现一项或多项功能的程序块.从定义可以看出:函数是一段程序,模块是一项程序块,也就是说函数,模块都是用来实现功能的,但是模块范围要广,在模块里可以重用多个函数 2.如何导入模块 在Python程序中如果要使用某个模块,不能直接使用某个模块的功能.在模块使用之前,我们需要先导入指定模块,只要导入模块后我们才能使用 >

python 模块的概念介绍

模块 模块:本质就是一个.py文件分为三部分:内置模块.第三方模块,自定义模块 模块: 顶层文件 python模块python模块可以将代码量较大的程序分割成多个有组织的.彼此独立但又能互相交互的代码片段,这些自我包含的有组织的代码段就是模块,模块在物理形式上表现为以.py结尾的代码文件一个文件被看作一个独立的模块,一个模块也可以被看作是一个文件模块的文件名就是模块的名字加上扩展名.py每个模块都有自己的名称空间python允许"导入"其他模块以实现代码重用,从而也实现了将独立的代码文

python 模块知识(持续更新......)

提示:当不会用模块方法的时候用help >>> import re >>>help(re.search) 查看模块的所有方法: >>>import re >>>dir(re) 1.sys 模块 sys.argv包含了命令行参数列表,脚本的名称总是sys.argv列表的第一个参数,也就是sys.argv[0] 2.os 模块 Python 模块包含普遍的操作系统功能. 在Python中运行shell命令 1.os.system('com

python 模块 模块文件

Python 程序架构: 一个程序是一个模块的系统,它有一个顶层脚本文件(启动后可以运行程序)以及多个模块文件,脚本和模块都是包含了Python语句的文本文件,并且Python的标准库提供了一系列的预先编写好的模块 Python 模块概述 一个python包括了多个含有Python语句的文本文件,程序是作为一个主体的的,顶层的文件来构造的,配合有另个或者多个支持的文件,在Python中这些文件称为模块 顶层文件(程序)包含了程序的主要控制流程(运行来启动应用的文件) 模块就是工具的库,这些工具用

python基础知识 01 python模块

Python基础知识 (1)python模块(2)如何声明python变量(3)进制转换(4)格式化数字(5)单行注释和多行注释(6)单引号和双引号字符串(7)拼接字符串(8)长字符串 第一课:python模块 python模块 = 封装了API的library 我们先不讲如何定义模块 ,我们先讲如何引用模块 模块分为2类 1.python自身提供的模块 2.自定义模块 //这两种方法呢,我们引用的方式是一样的 引用模块的关键字为import 这个和Java的引用方式是一样的,但是 有很大的区别

python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。

本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding:utf-8from com.wenhy.crawler_baidu_baike import url_manager, html_downloader, html_parser, html_outputer print "爬虫百度百科调度入口" # 创建爬虫类class SpiderMai

python时间处理模块 datetime time模块 deltetime模块

1 首先介绍time模块,因为简单 python 自带模块 本人使用time模块,只使用两个函数 time函数和sleep函数 import time a.     time.time()   函数 返回unix时间  常用作两个时间差的计算 b.     time.sleep()  休眠多久,精度为子秒(subsecond) In [90]: t1 = time.time() In [91]: t1 Out[91]: 1461400225.877932 In [92]: time.sleep(

Python模块的交叉引用问题分析

实际项目中遇到python模块相互引用问题,查资料,说是通过import局部导入的方式可以避免错误,资料如附录所述. 但更改后测试还是会出错,很疑惑!? 如果哪位读者有好的解决方法,敬请留言说明,谢谢. 所以,最好的方法是不进行交叉引用,如果需要就单独分一个模块出来. 附录:Python模块的交叉引用问题解读:How can I have modules that mutually import each other? 有下面两个文件相互引用,Python解释器报错. foo.py: from