python之路5:常用模块

  1. 模块简介
  2. time & datetime模块
  3. random
  4. os
  5. sys
  6. shutil
  7. json & pickle
  8. shelve
  9. xml处理
  10. configparser
  11. hashlib
  12. subprocess
  13. logging模块
  14. re正则表达式

模块简介:

模块,是用一堆代码实现了某个功能的代码集合,n个.py文件组成的代码集合就称为模块。

模块分为三种:

  • 自定义模块(自己手动编写的python代码文件)
  • 内置标准模块(又称标准库)
  • 开源模块

导入模块有以下几种方法:

import module #执行module.py文件的所有代码import packages #执行packages目录下__init__.py下的代码from module import test #从module.py文件只导入test方法from module import test as t #从module.py文件只导入test方法并改名为tfrom module import * #从module.py文件导入所有方法,如果有跟它同名的函数会被其覆盖,慎用

导入模块其实就是告诉Python解释器去解释那个py文件

  • 导入一个py文件,解释器解释该py文件
  • 导入一个包,解释器解释该包下的 __init__.py 文件

安装模块有以下两种方式:

1,使用系统命令:pip install

2,编译安装源代码包

编译源码    python setup.py build
安装源码    python setup.py install

time & datetime模块

时间相关的操作,时间有三种表示方式:

  • 时间戳               1970年1月1日之后的秒,即:time.time()
  • 格式化的字符串    2014-11-11 11:11,    即:time.strftime(‘%Y-%m-%d‘)
  • 结构化时间          元组包含了:年、日、星期等... time.struct_time    即:time.localtime()

 1 import time
 2 import datetime
 3 print(time.gmtime())#返回utc时间的struc时间对象格式
 4 print(time.strftime("%Y-%m-%d %H:%M:%S",time.gmtime()))#将utc struct_time格式转成指定的字符串格式
 5 #time.sleep(1)
 6 print(time.localtime())
 7 print(time.process_time())#测量处理器运算时间
 8 print(time.asctime())#返回时间格式如“Sun Apr  1 17:18:24 2018”
 9 print(time.ctime())#返回时间格式如“Sun Apr  1 17:18:24 2018”
10 string_2_struct = time.strptime("2018/04/11","%Y/%m/%d")#将日期字符串转成struct时间对象格式
11 print(string_2_struct)
12
13 print(datetime.datetime.now())#返回时间格式 2018-04-01 17:28:23.644249
14 print(datetime.date.fromtimestamp(time.time()))#时间戳直接转成日期格式 2018-04-01
15 print(datetime.datetime.now() + datetime.timedelta(1))#当前时间+1天
16 print(datetime.datetime.now() + datetime.timedelta(-1))#当前时间-1天
17 print(datetime.datetime.now() + datetime.timedelta(hours=1))#当前时间+1小时
18 print(datetime.datetime.now() + datetime.timedelta(minutes=10),‘\n‘)#当前时间+10分
19 c_time = datetime.datetime.now()
20 print(c_time.replace(minute=1,hour=3))#时间替换,把小时改为3,分钟改为1。


random模块

随机验证码实例:

 1 #!/usr/bin/env python
 2 # -*- coding:utf-8 -*-
 3 __author__ = ‘lvlibing‘
 4
 5 import random
 6 checkcode = ‘‘
 7
 8 for i in range(6):
 9     current = random.randrange(1,6)
10     if current == i:
11         tmp = chr(random.randint(65,90))
12     else:
13         tmp = random.randint(0,9)
14     checkcode+=str(tmp)
15
16 print(checkcode)

OS模块

提供对操作系统进行调用的接口

sys模块

用于提供对解释器相关的操作

 1 #!/usr/bin/env python
 2 # -*- coding:utf-8 -*-
 3 __author__ = ‘lvlibing‘
 4
 5 import os
 6 import sys
 7
 8 print(os.getcwd())#获取当前工作目录,即当前python脚本工作的目录路径
 9 print(os.curdir)#返回当前目录: ‘.‘
10 print(os.pardir)#获取当前目录的父目录字符串名:‘..‘
11 # os.chdir("dirname")#改变当前脚本工作目录
12 os.makedirs(‘J:\\test\\a\\b\\c\\d‘)#可递归生成多层目录
13 os.removedirs(‘J:\\test\\a\\b\\c\\d‘)#若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
14 os.mkdir(r‘J:\test\1‘)#生成单级目录
15 os.rmdir(r‘j:\test\1‘)#删除单级空目录,若目录不为空则无法删除
16 print(os.listdir(r‘j:\test‘))#列出指定目录下的所有文件和子目录,包括隐藏文件
17 #os.remove(r‘j:\test\test.txt‘)#删除一个文件
18 #os.rename(‘oldname‘,‘newname‘)#重命名文件/目录
19 print(os.stat(r‘j:\test‘))#获取文件/目录信息
20 print(os.name)#输出字符串指示当前使用平台
21 os.system(‘ipconfig‘)
22 print(os.environ)#获取系统环境变量
23 os.path.abspath(r‘j:\test\test.txt‘)#返回文件的绝对路径
24 os.path.split(r‘j:\test\test.txt‘)#将path分割成目录和文件名二元组返回
25 os.path.dirname(r‘j:\test\test.txt‘)#返回目录名
26 os.path.basename(r‘j:\test\test.txt‘)#返回文件名
27 os.path.exists(r‘j:\test\test.txt‘)#如果存在,返回True;如果不存在,返回False
28 os.path.isfile(r‘j:\test\test.txt‘)
29 print(os.path.isdir(r‘j:\test‘))
30 print(os.path.getatime(r‘j:\test‘))
31 print(os.path.getctime(r‘j:\test‘))
32 print(os.path.getmtime(r‘j:\test‘))
33 print(os.system(‘dir‘))#运行dos命令,直接显示结果
34
35 print(sys.argv)#命令行参数List,第一个元素是程序本身路径
36 print(sys.exit(n))#退出程序,默认正常退出时exit(0)

shutil 模块

提供对文件、文件夹、压缩包处理

shutil.copyfileobj(fsrc, fdst[, length])
将文件内容拷贝到另一个文件中,可以部分内容

shutil.copyfile(src, dst)
拷贝文件

shutil.copymode(src, dst)
仅拷贝权限。内容、组、用户均不变

shutil.copystat(src, dst)
拷贝状态的信息,包括:mode bits, atime, mtime, flags

shutil.copy(src, dst)
拷贝文件和权限

shutil.copy2(src, dst)
拷贝文件和状态信息

shutil.copytree(src, dst, symlinks=False, ignore=None)
递归的去拷贝文件

shutil.rmtree(path[, ignore_errors[, onerror]])
递归的去删除文件

shutil.move(src, dst)
递归的去移动文件

shutil.ignore_patterns(*patterns)

匹配模式到的文件忽略拷贝

json & pickle 模块

用于序列化的两个模块

  • json,用于字符串 和 python数据类型间进行转换
  • pickle,用于python特有的类型 和 python的数据类型间进行转换

Json模块提供了四个功能:dumps、dump、loads、load

pickle模块提供了四个功能:dumps、dump、loads、load

 1 #!/usr/bin/env python
 2 # -*- coding:utf-8 -*-
 3 # __Author__ = ‘lvlibing‘
 4
 5 import pickle
 6 import json
 7
 8 data = {‘k1‘:‘123‘,‘k2‘:‘hello‘,‘k3‘:‘你好‘}
 9 p_str1 = pickle.dumps(data)#将数据通过特殊的形式转换为只有python语言认识的字符串
10 p_str2 = json.dumps(data)#将数据通过特殊的形式转换为所有语言认识的字符串,只支持字符串、列表、字典类型转换
11 print(p_str1)
12 print(p_str2)
13
14 with open(‘data.pickle‘, ‘wb‘) as f:
15     pickle.dump(data,f)#将数据通过特殊的形式转换为只有python语言认识的字符串,并写入文件
16
17 #pickle.load(f)#恢复
18
19 if __name__ == ‘__main__‘:#只在程序本身被使用的时候运行
20     with open(‘data.json‘, ‘w‘) as fp:
21        json.dump(data,fp)#将数据通过特殊的形式转换为所有语言认识的字符串,只支持字符串、列表、字典类型转换,并写入文件
22
23 #json.load(fp)#恢复

shelve 模块

shelve模块是一个简单的k,v将内存数据通过文件持久化的模块,可以持久化任何pickle可支持的python数据格式

 1 # -*- coding:utf-8 -*-
 2 __author__ = ‘BillyLV‘
 3
 4 import shelve
 5 import datetime
 6
 7 d = shelve.open(‘shelve_test‘)  # 打开一个文件
 8
 9 l1 = ["alex", "jack", "test"]
10 d1 = {‘name‘:‘lv‘,‘job‘:‘it‘}
11 d["list"] = l1  # 持久化列表
12 d["dict"] = d1 # 持久化字典
13 d[‘dtime‘] = datetime.datetime.now()#持久化当前时间
14
15 print(d.get(‘list‘))#获取l1列表信息
16 print(d.get(‘dict‘))#获取d1字典信息
17 print(d.get(‘dtime‘))
18
19 d.close()

xml处理模块

xml是实现不同语言或程序之间进行数据交换的协议,xml协议在各个语言里的都是支持的。

 1 <data>
 2     <country name="Liechtenstein">
 3         <rank updated="yes">2</rank>
 4         <year>2008</year>
 5         <gdppc>141100</gdppc>
 6         <neighbor direction="E" name="Austria" />
 7         <neighbor direction="W" name="Switzerland" />
 8     </country>
 9     <country name="Singapore">
10         <rank updated="yes">5</rank>
11         <year>2011</year>
12         <gdppc>59900</gdppc>
13         <neighbor direction="N" name="Malaysia" />
14     </country>
15     <country name="Panama">
16         <rank updated="yes">69</rank>
17         <year updated="yes">2013</year>
18         <gdppc>13600</gdppc>
19         <neighbor direction="W" name="Costa Rica" />
20         <neighbor direction="E" name="Colombia" />
21     </country>
22 </data>

 1 # -*- coding:utf-8 -*-
 2 __author__ = ‘BillyLV‘
 3
 4 import xml.etree.ElementTree as ET
 5
 6 tree = ET.parse(‘xmltest.xml‘)
 7 root = tree.getroot()
 8 print(root.tag,‘\n‘)
 9
10 #遍历xml文档
11 for child in root:
12     print(child.tag,child.attrib)
13     for i in child:
14         print(i.tag,i.text,‘\n‘)
15
16 #只遍历year 节点
17 for node in root.iter(‘year‘):
18     print(node.tag, node.text)
19
20 #修改
21 for sec_node in root.iter(‘year‘):
22     new_year = int(sec_node.text) + 1
23     node.text = str(new_year)
24     node.set(‘updated‘,‘yes‘)
25
26 tree.write(‘xmltest.xml‘)
27
28 #删除
29 for country in root.findall(‘country‘):
30     rank = int(country.find(‘rank‘).text)
31     if rank > 50:
32         root.remove(country)
33
34 tree.write(‘output.xml‘)
35
36 #创建xml文档
37 new_xml = ET.Element(‘namelist‘)
38 name = ET.SubElement(new_xml,‘name‘,attrib={‘encrolled‘:‘no‘})
39 sex = ET.SubElement(name,‘age‘,attrib={‘checked‘:‘no‘})
40 sex.text = ‘29‘
41 name2 = ET.SubElement(new_xml,‘name‘,attrib={‘encrolled‘:‘yes‘})
42 age = ET.SubElement(name2,‘age‘)
43 age.text = ‘18‘
44 et = ET.ElementTree(new_xml)
45 et.write(‘test.xml‘,encoding=‘utf-8‘,xml_declaration=True)
46 ET.dump(new_xml)

ConfigParser模块

用于生成和修改常见配置文档

 1 import configparser
 2
 3 config = configparser.ConfigParser()
 4 config["DEFAULT"] = {‘ServerAliveInterval‘: ‘45‘,
 5                      ‘Compression‘: ‘yes‘,
 6                      ‘CompressionLevel‘: ‘9‘}
 7
 8 config[‘bitbucket.org‘] = {}
 9 config[‘bitbucket.org‘][‘User‘] = ‘hg‘
10 config[‘topsecret.server.com‘] = {}
11 topsecret = config[‘topsecret.server.com‘]
12 topsecret[‘Host Port‘] = ‘50022‘  # mutates the parser
13 topsecret[‘ForwardX11‘] = ‘no‘  # same here
14 config[‘DEFAULT‘][‘ForwardX11‘] = ‘yes‘
15 with open(‘example.ini‘, ‘w‘) as configfile:
16     config.write(configfile)
17 config.sections()
18 config.read(‘example.ini‘)
19 config.sections()

hashlib模块 

用于加密相关的操作,3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法

hmac 模块

它内部对我们创建 key 和 内容 再进行处理然后再加密

 1 import hashlib,hmac
 2
 3 hash = hashlib.sha512()
 4 hash.update(b‘admin‘)
 5 print(hash.hexdigest())
 6
 7 m = hashlib.md5(b‘sdfa23ds14‘)
 8 m.update(b"Hello")
 9 m.update(b"It‘s me")
10 print(m.hexdigest())#16进制格式
11 m.update(b"It‘s been a long time since last time we ...")
12 print(m.digest())#2进制格式
13
14 mac = hmac.new(b‘dqqq33f‘)
15 mac.update(b"Enhanced")
16 print(mac.hexdigest())

Subprocess模块 

用于执行系统命令

可用参数:

      • args:shell命令,可以是字符串或者序列类型(如:list,元组)
      • bufsize:指定缓冲。0 无缓冲,1 行缓冲,其他 缓冲区大小,负值 系统缓冲
      • stdin, stdout, stderr:分别表示程序的标准输入、输出、错误句柄
      • preexec_fn:只在Unix平台下有效,用于指定一个可执行对象(callable object),它将在子进程运行之前被调用
      • close_sfs:在windows平台下,如果close_fds被设置为True,则新创建的子进程将不会继承父进程的输入、输出、错误管道。
        所以不能将close_fds设置为True同时重定向子进程的标准输入、输出与错误(stdin, stdout, stderr)。
      • shell:同上
      • cwd:用于设置子进程的当前目录
      • env:用于指定子进程的环境变量。如果env = None,子进程的环境变量将从父进程中继承。
      • universal_newlines:不同系统的换行符不同,True -> 同意使用 \n
      • startupinfo与createionflags只在windows下有效
        将被传递给底层的CreateProcess()函数,用于设置子进程的一些属性,如:主窗口的外观,进程的优先级等等

terminate() 杀掉所启动进程
communicate() 等待任务结束

logging模块

用于便捷记录日志且线程安全的模块

logging的日志可以分为 debug < info < warn(warning) < error < critical(fatal)5个级别,只有大于或等于当前日志级别的操作才会被记录。

 1 # -*- coding:utf-8 -*-
 2 __author__ = ‘BillyLV‘
 3
 4 import logging
 5
 6 logging.warning("user [lv] attempted wrong password more than 3 times")
 7 logging.critical("server is down")
 8
 9 # 高于或等于INFO级别的才会输出
10 logging.basicConfig(filename=‘example.log‘,level=logging.INFO)
11 logging.debug(‘This message should go to the log file‘)
12 logging.info(‘So should this‘)
13 logging.warning(‘And this, too‘)
14
15 # 带时间格式
16 logging.basicConfig(format=‘%(asctime)s %(message)s‘, datefmt=‘%m/%d/%Y %I:%M:%S %p‘)
17 logging.warning(‘is when this event was logged.‘)
18
19 from logging import handlers
20
21 logger = logging.getLogger(__name__)
22
23 log_file = "timelog.log"
24 #fh = handlers.RotatingFileHandler(filename=log_file,maxBytes=10,backupCount=3)
25 fh = handlers.TimedRotatingFileHandler(filename=log_file,when="S",interval=5,backupCount=3)
26
27 formatter = logging.Formatter(‘%(asctime)s %(module)s:%(lineno)d %(message)s‘)
28
29 fh.setFormatter(formatter)
30
31 logger.addHandler(fh)
32
33 logger.warning("test1")
34 logger.warning("test12")
35 logger.warning("test13")
36 logger.warning("test14")

re模块

用于对python的正则表达式的操作。

字符:

  . 匹配除换行符以外的任意字符
  \w 匹配字母或数字或下划线或汉字
  \s 匹配任意的空白符
  \d 匹配数字
  \b 匹配单词的开始或结束
  ^ 匹配字符串的开始
  $ 匹配字符串的结束

次数:

  * 重复零次或更多次
  + 重复一次或更多次
  ? 重复零次或一次
  {n} 重复n次
  {n,} 重复至少n次
  {n,m} 重复n到m次

re.match 从起始位置开始根据模型去字符串中匹配指定内容,匹配单个

re.search 根据模型去字符串中匹配指定内容,匹配单个

re.findall 匹配字符串中所有符合条件的元素

re.splitall 以匹配到的字符当做列表分隔符

re.sub     匹配字符并替换

反斜杠:

匹配一个数字的"\\d"可以写成r"\d"

re.I(re.IGNORECASE): 忽略大小写(括号内是完整写法,下同)

M(MULTILINE): 多行模式,改变‘^‘‘$‘的行为

S(DOTALL): 点任意匹配模式,改变‘.‘的行为

# -*- coding:utf-8 -*-
__author__ = ‘BillyLV‘

import re

print(re.findall("ab*","cabb3abcbbac"))
print(re.findall("ab+","ab+cd+abb+bba"))
a = re.search("abc|ABC","ABCBabcCD").group()
print(a)
b = re.search("(abc){2}a(123|456)c", "abcabca123c").group()
print(b)
print(re.search("^al","alexabc"))
#分组匹配
c=re.search("(?P<province>[0-9]{3})(?P<city>[0-9]{3})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city")
print(c)

  

参考:

http://www.cnblogs.com/alex3714

http://www.cnblogs.com/wupeiqi

internet&python books

PS:如侵权,联我删。

原文地址:https://www.cnblogs.com/BillyLV/p/8744225.html

时间: 2024-08-03 21:52:28

python之路5:常用模块的相关文章

python之路:Day05 --- 常用模块

本节内容 1.模块介绍 2.sys 3.os 4.time & datetime 模块 5.random 6.shutil 7.hashlib 8.logging 9.re正则表达式 10.shelve 11.xml 处理 12.yaml 处理 13.configpareser 14.subprocess 一.模块介绍 模块,用一砣代码实现了某个功能的代码集合. 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能

Python 之路 Day5 - 常用模块学习

本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve xml处理 yaml处理 configparser hashlib subprocess logging模块 re正则表达式 模块,用一砣代码实现了某个功能的代码集合. 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能来,可能需要多个函数才能完成(函数又可以在不同的.p

第六章:Python基础の反射与常用模块解密

本課主題 反射 Mapping 介绍和操作实战 模块介绍和操作实战 random 模块 time 和 datetime 模块 logging 模块 sys 模块 os 模块 hashlib 模块 re 模块 本周作业 反射 Mapping 介绍和操作实战 反射是利用字符串的形式去对象 (模块) 中操作 (寻找/检查) 成员 案例例子 假设创建了一个common.py 程序里而有3个功能,比如网站里的登录页面.主页页面还有登出页面都是不同的页面,要显示的内容都不一样. def login(): p

Python之路,Day21 - 常用算法学习

Python之路,Day21 - 常用算法学习 本节内容 算法定义 时间复杂度 空间复杂度 常用算法实例 1.算法定义 算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制.也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出.如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题.不同的算法可能用不同的时间.空间或效率来完成同样的任务.一个算法的优劣可以用空间复杂度与时间复杂度来衡量. 一个算

Python学习之路13?常用模块

一 time模块 在Python中,通常有这几种方式来表示时间: 时间戳(timestamp):通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量.我们运行"type(time.time())",返回的是float类型. 格式化的时间字符串(Format String) 结构化的时间(struct_time):struct_time元组共有9个元素共九个元素:(年,月,日,时,分,秒,一年中第几周,一年中第几天,夏令时) 1 import time 2 #

python之路-16-常用模块学习

16.1模块定义 定义:用一砣代码实现了某个功能的代码集合(n个 .py 文件组成的代码集合就称为模块) 模块分为三种: 自定义模块 内置标准模块(又称标准库) 开源模块 16.2导入方法 单个模块导入:import module_name 一个模块多个函数:from module_lanhan import * 别名导入:from module_lanhan import def_name as module_lanhan_def_name 多模块一起导入需要用逗号(,)隔开 Import m

Python 3.5(常用模块)

常用模块: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve xml处理 yaml处理 configparser hashlib subprocess logging模块 模块分为三种: 自定义模块 内置标准模块(又称标准库) 开源模块 #_*_coding:utf-8_*_ __author__ = 'Alex Li' import time # print(time.clock()) #返回处理器时间,3.3开

python学习笔记(六):常用模块

一.模块.包 什么是模块? 模块实质上就是一个python文件,它是用来组织代码的,意思就是说把python代码写到里面,文件名就是模块的名称,test.py test就是模块名称. 什么是包? 包,package本质就是一个文件夹,和文件夹不一样的是它有一个__init__.py文件,包是从逻辑上来组织模块的,也就是说它是用来存放模块的,如果你想导入其他目录下的模块,那么这个目录必须是一个包才可以导入. 导入模块 1 2 3 4 5 import module #导入模块 from modul

Python 学习笔记(6)--常用模块(2)

一.下载安装 下载安装有两种方式: yum\pip\apt-get 或者源码 下载源码 解压源码 进入目录 编译源码 python setup.py build 安装源码 python setup.py install 注:在使用源码安装时,需要使用到gcc编译和python开发环境,所以,需要先执行: yum install gcc python-devel 安装成功后,模块会自动安装到 sys.path 中的某个目录中,如: /usr/lib/python2.7/site-packages/

python之路--day15--常用模块之logging模块

常用模块 1 logging模块 日志级别:Noset (不设置) Debug---(调试信息)----也可用10表示 Info--(消息信息)----也可用20表示 Warning---(警告信息)----也可用30表示 Error------(错误消息)----也可用40表示 Critical---(严重错误)---也可用50表示 默认级别是Warning,默认打印到终端 1 import logging 2 3 logging.debug('调试debug') 4 logging.info