Python学习(十二)—— 常见模块

常见内置模块

time模块

时间戳(单位是秒,代表由1970年元旦凌晨至今过去的时间),常用于计算 .time():

1 import time
2 #时间戳,单位是s
3 print(time.time())
4 # 1583246063.46606

结构化时间

(显示当地当前的精确时间 年月日...).localtime()

1 print(time.localtime())
2 # time.struct_time(tm_year=2020, tm_mon=3, tm_mday=3, tm_hour=22, tm_min=36, tm_sec=33, tm_wday=1, tm_yday=63, tm_isdst=0)

  可以取出想要的时间信息

1 t = time.localtime()
2 print(t.tm_wday) #周几是从周0开始算的
3 # 1
4 print(t.tm_year)
5 # 2020

(显示当前格林威治的精确时间 年月日...).gmtime():

1 g = time.gmtime()
2 print(g)
3 # time.struct_time(tm_year=2020, tm_mon=3, tm_mday=3, tm_hour=14, tm_min=41, tm_sec=47, tm_wday=1, tm_yday=63, tm_isdst=0)
4 print(g.tm_wday) #周几是从周0开始算的
5 # 1
6 print(g.tm_year)
7 # 2020

将结构化时间转化成对应的时间戳 .mktime()

1 print(time.mktime(time.localtime()))
2 # 1583246793.0

将结构化时间转换成字符串时间 .strftime()

1 print(time.strftime("%Y-%m_%d %X",time.localtime()))
2 # 2020-03_03 22:52:02

将字符串时间转换成结构化时间 .strptime()

1 print(time.strptime("2020:1:1:20:8:30","%Y:%m:%d:%X"))
2 # time.struct_time(tm_year=2020, tm_mon=1, tm_mday=1, tm_hour=20, tm_min=8, tm_sec=30, tm_wday=2, tm_yday=1, tm_isdst=-1)

将结构化时间转换成给定格式的时间,不得修改 .asctime()

1 print(time.asctime())
2 # Tue Mar  3 22:57:48 2020

将时间戳转换成给定格式的时间,不得修改 .ctime()

1 print(time.ctime(time.time()))
2 # Tue Mar  3 23:00:18 2020

字符串时间

补充一个关于时间的模块 datetime

1 import datetime
2 print(datetime.datetime.now())
3 # 2020-03-03 23:02:47.361912

random模块

随机浮点型、浮点型范围、随机整型、随机整型的范围

1 import random
2 print(random.random())
3 # 0.3947431257812979
4 print(random.uniform(1,5))#指定范围
5 # 4.521865000424089
6 print(random.randint(4,10)) #指定范围
7 # 8
8 print(random.randrange(4,1000))
9 # 384

在可迭代对象内随机取一个

1 print(random.choice([11,33,44,66]))
2 # 44

在可迭代对象内随机取多个

1 print(random.sample([11,33,44,66],3))
2 # [66, 11, 44]

打乱次序(洗牌)

1 l = [11,33,44,66]
2 random.shuffle(l)
3 print(l)
4 # [11, 66, 33, 44]

举例:做验证码

 1 import random
 2 def v_code():
 3     ret = ""
 4     for i in range(5):
 5         num = random.randint(0,9)
 6         alf = chr(random.randint(65,122))
 7         s = str(random.choice([num,alf]))
 8         ret += s
 9       return ret
10
11 print(v_code())
12 # sj232

os模块

os.getcwd() 获取当前工作的目录

os.chdir("dirname") 改变当前工作目录

1 import os
2 print(os.getcwd())
3 # D:\PythonStudy\Python全栈\day22
4 os.chdir("test")
5 print(os.getcwd())
6 # D:\PythonStudy\Python全栈\day22\test
7 os.chdir("..") #返回上一层
8 print(os.getcwd())
9 # D:\PythonStudy\Python全栈\day22

os.curdir 返回当前目录

os.pardir 返回当前目录的父目录字符串名

1 os.curdir#返回当前目录
2 print(os.getcwd())
3 os.pardir #返回当前目录的父目录字符串名
4 print(os.getcwd())

os.makedirs("dirname1/dirname2") 生成多层递归目录

os.removedirs("dirname1") 若为空目录,则删除,并递归到上一级目录,如若也为空,则删除,依此类推

os.mkdirs(‘dirname") 生成单级目录

os.rmdir("dirname") 删除单级空目录,若目录非空则无法删除且报错

1 # os.makedirs("dir1/dir2") 创建多级目录
2 os.rmdir("dir1/dir2")  #删除单级空目录

os.listdir("dirname") 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印

os.remove() 删除一个文件

os.rename("oldname","newname") 重命名文件/目录

os.stat("path/filename") 获取文件/目录信息(创建时间、修改时间、节点数、设备、用户名、字节数...)

os.sep 输出操作系统特定的路径分隔符,win下为“\\”,Linux为“/”

os.linesep 输出当前平台使用的行终止符,win下为“\r\n”,Linux为“\n”

os.pathsep 输出用于分割文件路径的字符串

os.name 输出字符串指示当前的使用平台,win下为“nt”,Linux为“posix”

os.system("bash command") 运行shell命令,直接显示

os.environ 获取系统的环境变量

os.path.abspath(path) 返回path的绝对路径

os.path.split(path) 将path分割成目录和文件名二元组返回

os.path.dirname(path) 返回path的目录。 其实就是os.path.split(path)的第一个元素

os.path.basename() 返回path最后的文件名。如果path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素

1 print(os.path.split(r"D:\PythonStudy\Python全栈\day22\lesson1.py"))
2 # (‘D:\\PythonStudy\\Python全栈\\day22‘, ‘lesson1.py‘)
3 print(os.path.dirname(r"D:\PythonStudy\Python全栈\day22\lesson1.py"))
4 # D:\PythonStudy\Python全栈\day22
5 print(os.path.basename(r"D:\PythonStudy\Python全栈\day22\lesson1.py"))
6 # lesson1.py

os.path.exists(path) 如果path存在,返回True,否则False

os.path.isabs(path) 如果path是绝对路径,返回True,否则False

os.path.isfile(path) 如果path是一个存在的文件,返回True,否则False

os.path.isdir(path) 如果path是一个存在的目录,返回True,否则False

os.path.join(path[,path[,...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略

1 a = "D:\PythonStudy\Python全栈"
2 b = "day22\lesson1.py"
3 print(os.path.join(a,b))
4 # D:\PythonStudy\Python全栈\day22\lesson1.py

os.path.getatime(path) 返回path所指向的文件或者目录的最后存取时间

os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间

system模块

sys.argv 命令行参数List,第一个元素是程序本身路径

sys.exit(n) 退出程序,正常退出时exit(0)

sys.version() 获取Python解释程序的版本信息

sys.maxint 最大的Int值

sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值

sys.platform 返回操作系统平台名称

进度条的例子

1 import time,sys
2 for i in range(10):
3     sys.stdout.write("*")
4     time.sleep(0.4)
5     sys.stdout.flush #刷新,立刻显示
6 # **********

json模块

可以进行任何数据类型的转换(能够跨语言)

使用eval转换,但有局限性。

1 f = open("hello","r")
2 data = f.read()
3 print(data,type(data))
4 # {"name":"alex"} <class ‘str‘>
5 data = eval(data)
6 print(data["name"],type(data))
7 # alex <class ‘dict‘>

json.dumps() 任何输入类型都会变成字符串,字符串存在时,单引号会变成双引号

 1 import  json
 2 dic = {"alex":"18"}
 3 l = [11,22,33]
 4 num = 89
 5 tu= (1,"w")
 6 dic = json.dumps(dic)
 7 print(dic,type(dic))
 8 l = json.dumps(l)
 9 print(l,type(l))
10 num = json.dumps(num)
11 print(num,type(num))
12 tu = json.dumps(tu)
13 print(tu,type(tu))
14 # {"alex": "18"} <class ‘str‘>
15 # [11, 22, 33] <class ‘str‘>
16 # 89 <class ‘str‘>
17 # [1, "w"] <class ‘str‘>

写入字符串(使用json.dumps(data))

1 import json
2 f = open("new_hello","w")
3 data = json.dumps({‘name‘:‘alex‘})
4 f.write(data) # json.dump({‘name‘:‘alex‘},f)
5 print(data,type(data)) 6 # new_hello {"name": "alex"}

json.loads() 变换为原来的数据类型

1 f = open("new_hello","r")
2 data = f.read()
3 print(data,type(data))
4 # {"name": "alex"} <class ‘str‘>
5 new_data = json.loads(data) # new_data = json.load(f)
6 print(new_data,type(new_data)) 7 # {‘name‘: ‘alex‘} <class ‘dict‘>

pickle模块

和json模块使用完全一样,结果转换为字节“bytes”,功能有局限性。

序列化:把对象(变量)从内存中变成可存储或传输的过程称为序列化。在Python中称为pickling,在其他语言上称为serialization,marshalling,flattening等。

序列化之后,可以把序列化后的内容写入磁盘,或者通过网络传输到其他机器上。

相反的过程称为反序列化,即unpickling。

shelve模块

类似pickle,使用更简单,有局限性。

1 import shelve
2 f = shelve.open(r"text1")
3 f["name"] = "alex"
4 f["internships"] = {1:"babycare",2:"assistance",3:"worker"}
5 #会写出三个名为text1的文件,内容肉眼不可识别
6 print(f.get("internships")[2])
7 # assistance

XML模块 xml.etree.ElementTree

实现不同语言或程序之间进行数据交换的协议,类似json,但json使用更加简单。

查询功能:

 1 #!/usr/bin/env python
 2 # -*- coding:utf-8 -*-
 3 import xml.etree.ElementTree as ET #简写
 4
 5 tree = ET.parse("xml_lesson")
 6 root = tree.getroot()
 7 print(root.tag)
 8 # data
 9 #遍历标签
10 for i in root:
11     print(i)
12 # <Element ‘country‘ at 0x0000020DF9496B38>
13 # <Element ‘country‘ at 0x0000020D8864EA48>
14 # <Element ‘country‘ at 0x0000020D8864EBD8>
15 for i in root:
16     print(i.tag)
17     # country
18     # country
19     # country
20 # 遍历标签
21 for i in root:
22     for j in i:
23         print(j.attrib)
24         # {‘updated‘: ‘yes‘}
25         # {‘updated‘: ‘yes‘}
26         # {}
27         # {‘direction‘: ‘E‘, ‘name‘: ‘Austria‘}
28         # {‘direction‘: ‘W‘, ‘name‘: ‘Switzerland‘}
29         # {‘updated‘: ‘yes‘}
30         # {‘updated‘: ‘yes‘}
31         # {}
32         # {‘direction‘: ‘N‘, ‘name‘: ‘Malaysia‘}
33         # {‘updated‘: ‘yes‘}
34         # {‘updated‘: ‘yes‘}
35         # {}
36         # {‘direction‘: ‘W‘, ‘name‘: ‘Costa Rica‘}
37         # {‘direction‘: ‘E‘, ‘name‘: ‘Colombia‘}
38 #遍历标签包裹的内容
39 for i in root:
40     for j in i:
41         print(j.text)
42         # 2
43         # 2010
44         # 141100
45         # None
46         # None
47         # 5
48         # 2013
49         # 59900
50         # None
51         # 69
52         # 2013
53         # 13600
54         # None
55         # None
56 #只遍历year节点
57 for node in root.iter("year"):
58     print(node.tag,node.text)
59     # year 2010
60     # year 2013
61     # year 2013

修改功能:

 1 import xml.etree.ElementTree as ET #简写
 2
 3 tree = ET.parse("xml_lesson")
 4 root = tree.getroot()
 5 print(root.tag)
 6
 7 for node in root.iter("year"):
 8     new_year = int(node.text)+1
 9     node.text = str(new_year) #修改属性值
10     node.set("updated","yes") #修改标签
11 tree.write("abc.xml")

删除功能:

1 import xml.etree.ElementTree as ET #简写
2
3 tree = ET.parse("xml_lesson")
4 root = tree.getroot()
5 for country in root.findall("country"):
6     rank = int(country.find("rank").text)
7     if rank > 50:
8         root.remove(country)
9 tree.write("aaa.xml")

创建xml文件

 1 import xml.etree.ElementTree as ET
 2 new_xml = ET.Element("namelist")
 3 name = ET.SubElement(new_xml, "name", attrib={"enrolled": "yes"})
 4 age = ET.SubElement(name, "age", attrib={"checked": "no"})
 5 sex = ET.SubElement(name, "sex")
 6 sex.text = ‘33‘
 7 name2 = ET.SubElement(new_xml, "name", attrib={"enrolled": "no"})
 8 age = ET.SubElement(name2, "age")
 9 age.text = ‘19‘
10
11 et = ET.ElementTree(new_xml)  # 生成文档对象
12 et.write("test.xml", encoding="utf-8", xml_declaration=True)
13 ET.dump(new_xml)  # 打印生成的格式
14 # <namelist><name enrolled="yes"><age checked="no" /><sex>33</sex></name><name enrolled="no"><age>19</age></name></namelist>

re模块

究其本质,正则表达式(或RE)是一种小型的高度专业化的编程语言。它内嵌在Python中,并通过re模块实现。re表达式模式被编译成一系列的字节码,然后由C编写的匹配引擎执行。

用途:实现模糊匹配

字符匹配:
1、普通字符:大多数字符和字母都和本身匹配

2、元字符:. ^ $ * + ? { } [ ] | ( ) \

    

. 通配符,除\n以外任何字符都可以匹配,一个.代表一个字符

^  放在字符串的开头,代表必须从字符串的开头匹配

$ 放在字符串的结尾,代表必须从字符串的结尾匹配

* 按照左侧紧挨着的字符重复,重复0~∞次,贪婪匹配,在后面加?可以变为惰性匹配

+ 按照左侧紧挨着的字符重复,重复1~∞次,贪婪匹配,在后面加?可以变为惰性匹配

? 按照左侧紧挨着的字符重复,重复0~1次,贪婪匹配,在后面加?可以变为惰性匹配

 1 import re
 2
 3 # . 通配符
 4 ret = re.findall("a..x","wqawlxweg")
 5 print(ret)
 6 # [‘awlx‘]
 7
 8 # ^ 放在字符串的开头,代表必须从字符串的开头匹配
 9 ret = re.findall("^a..x","wqawlxweg")
10 print(ret)
11 # []
12 ret = re.findall("^a..x","acwxwqawlxweg")
13 print(ret)
14 # [‘acwx‘]
15
16 # $ 放在字符串的结尾,代表必须从字符串的结尾匹配
17 ret = re.findall("a..x$","acwxwqawlawex")
18 print(ret)
19 # [‘awex‘]
20
21 # * 按照左侧紧挨着的字符重复,重复0~∞次
22 ret = re.findall("a*$","qaawxwqawlawexaaa")
23 print(ret)
24 # [‘aaa‘, ‘‘] #没匹配到也算"
25 ret = re.findall("alex*","wxwqawlawexale")
26 print(ret)
27 # [‘ale‘] #没匹配到也算"
28
29 # + 按照左侧紧挨着的字符重复,重复1~∞次
30 ret = re.findall("a+$","qaawxwqawlawexaaa")
31 print(ret)
32 # [‘aaa‘]
33
34 # ? 按照左侧紧挨着的字符重复,重复0~1次
35 ret = re.findall("alex?","wxwqawlawexalexxxx")
36 print(ret)
37 # [‘alex‘]
38 ret = re.findall("alex??","wxwqawlawexalexxxx")
39 print(ret)
40 # [‘ale‘]

{ } 任意方式重复匹配

  --{0,} == *

  --{1,} == +

  --{0,1} == ?

\  转义符号

  用\加元字符,可以把元字符变成普通字符

  用\加普通字符,可以让普通字符实现特殊功能:

    \d 匹配任何十进制数

    \D 匹配任何非数字字符

    \s 匹配任何空白符号

    \S 匹配任何非空白符号

    \w 匹配任何字母数字字符

    \W 匹配任何非字母数字字符

    \b 匹配一个特殊字符边界,比如空格,&,#等

[ ] 是字符集,内部除了四个符号以外都是普通字符

  1、 -代表范围

  2、 ^代表非

  3、 \转义符号

  4、/

login模块

原文地址:https://www.cnblogs.com/jennifer224/p/12405614.html

时间: 2024-07-29 00:43:25

Python学习(十二)—— 常见模块的相关文章

Python进阶(十二)----re模块

Python进阶(十二)----re模块 一丶re模块 ? re模块是python将正则表达式封装之后的一个模块.正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行. #正则表达式: 从一串字符中,找出你想要的字符串. import re ### 单个元字符的匹配 # \W 除了数字 ,字母,中文, 下划线 print(re.findall('\W','dsadas1231 +1-+2*/,.')) # \w 匹配中文,数字,字母,下划线 print(re.findall('\w

Python学习十二:高阶函数

在学习高阶函数之前需要搞清一个概念: 变量可以指向函数 意思就是:把函数名赋值给另一个变量,然后使用这个变量完成跟函数一样的功能. 如下代码所示: 将求绝对值函数abs赋值给f,然后调用f完成跟abs一样的功能. >>> f = abs >>> f(-100) 100 >>> 好了接下来看:高阶函数 定义为:一个函数接收另一个函数作为参数,这种函数就称之为高阶函数. 如下代码所示: def add(x , y , f): return f(x) + f

初学 Python(十二)——高阶函数

初学 Python(十二)--高阶函数 初学 Python,主要整理一些学习到的知识点,这次是高阶函数. #-*- coding:utf-8 -*- ''''' 话说高阶函数: 能用函数作为参数的函数 称为高阶函数 ''' #函数作参 def f(x): return x*x #map函数为内置函数,意思为将第二个参数的list作用到f函数中 #最后的结果为一个list print map(f,[1,2,3,4,5]) #reduce函数为内置函数,意思将第二参数的序列作用到add函数值 #将结

Python学习(二):入门篇:python中流程控制与函数编写

python中流程控制与函数编写 Last Eidt 2014/5/2 转载请注明出处http://blog.csdn.net/jxlijunhao 一,流程控制 1)布尔逻辑 Python中利用True来表示逻辑真,False来逻辑假 not :非 and:与 or   :或 ==  :逻辑等 >>> False==True False >>> False==False True >>> not False True >>> Fal

python 学习_第四模块 并发编程(多线程)

python 学习_第四模块 并发编程(多线程) 1  开启线程方式 from threading import Thread import time def say(name): time.sleep(2) print("%s hello"%name) if __name__ =="__main__": t = Thread(target=say,args=("alex",)) t.start() print("主线程")

Python第十六课(模块3)

Python第十六课(模块3)    >>>思维导图>>>中二青年 模块与包 模块 """ 三种来源 1.内置的 2.第三方的 3.自定义的 四种表示形式 1.py文件(******) 2.共享库 3.文件夹(一系列模块的结合体)(******) 4.C++编译的连接到python内置的 """ 导入模块 """ 先产生一个执行文件的名称空间 1.创建模块文件的名称空间 2.执行模

python学习(二)百度爬虫0.1

参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握. 我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警. 因此,基于需求,分如下步骤: 第一:基于Scrapy创建爬虫项目: 第二:新建TieBaSpider爬虫: 第三:新建外部关键字库dictionary.txt文件,贴吧地址配置url.txt文件: 第一步参考晚上案例. 从第二步开始,编写爬虫,同时创建实例对象以及创

Python学习笔记-安装MySQLdb模块

模块下载地址: MySQL-python 1.2.3 for Windows and Python 2.7, 32bit and 64bit versions http://www.codegood.com/archives/129 直接点击安装exe即可,如果缺少dll文件,可以百度下载相关dll文件. Python学习笔记-安装MySQLdb模块

springMVC3学习(十二)--文件上传优化CommonsMultipartResolver

基于上一篇文件上传发现效率很慢,我们应该对它进行优化  使用springMVC对文件上传的解析器 来处理文件上传的时候需要在spring的applicationContext里面加上springMVC提供的MultipartResolver的申明 这样客户端请求的时候 springMVC会检查request里面是否包含多媒体信息 如果包含了就会使用MultipartResolver进行解析, springMVC会使用一个支持文件  处理的MultipartHttpServletRequest来包

SpringMVC学习(十二)——SpringMVC中的拦截器

SpringMVC学习(十二)--SpringMVC中的拦截器 SpringMVC的处理器拦截器类似于Servlet开发中的过滤器Filter,用于对处理器进行预处理和后处理.本文主要总结一下SpringMVC中拦截器是如何定义的,以及测试拦截器的执行情况和使用方法. SpringMVC中拦截器的定义和配置 SpringMVC中拦截器的定义 在SpringMVC中,定义拦截器要实现HandlerInterceptor接口,并实现该接口中提供的三个方法,如下: public class Inter