python3_pickle模块详解

python3 pickle持久化的储存数据。

python程序运行中得到了一些字符串,列表,字典等数据,想要长久的保存下来,方便以后使用,而不是简单的放入内存中关机断电就丢失数据。python模块大全中pickle模块就排上用场了, 他可以将对象转换为一种可以传输或存储的格式。

pickle对象串行化

  • pickle模块将任意一个python对象转换成一系统字节的这个操作过程叫做串行化对象;

pickle与cpickle比较

  • pickle完全用python来实现的,cpickle用C来实现的,cpickle的速度要比pickle快好多倍,电脑中如果有cpickle的话建议使用cpickle。

pickle模块中常用的函数:

  1. pickle.dump(obj, file, [,protocol])

    • 含义:pickle.dump(对象,文件,[使用协议])
    • 将要持久化的数据“对象”,保存到“文件”中,使用有3种协议,索引0为ASCII,1为旧式二进制,2为新式二进制协议,不同之处在于2要更高效一些。
    • 默认dump方法使用0做协议
  2. pickle.load(file)
    • 含义:pickle.load(文件),将file中的对象序列化读出。
    • 从“文件”中读取字符串,将他们反序列化转换为python的数据对象,可以像操作数据类型的这些方法来操作它们;  
  3. pickle.dumps(obj[, protocol])
    • 函数的功能:将obj对象序列化为string形式,而不是存入文件中。
    • obj:想要序列化的obj对象。
    • protocal:如果该项省略,则默认为0。如果为负值或HIGHEST_PROTOCOL,则使用最高的协议版本。
  4. pickle.loads(string)
    • 函数的功能:从string中读出序列化前的obj对象。
    • string:文件名称。

dump() 与 load() 相比 dumps() 和 loads() 还有另一种能力:dump()函数能一个接一个地将几个对象序列化存储到同一个文件中,随后调用load()来以同样的顺序反序列化读出这些对象。

pickle实例代码:

1、一个字典a,用dumple()存储到本地文件,所存数据的格式就是字典,而普通的file.write()写入文件的是字符串。读取时,load()返回的是一个字典,file.read()返回的是一个字符串。

 1 import pickle
 2
 3
 4 a = {" name ": "Tom", "age": "40"}
 5 with open(‘text.txt‘, ‘wb‘) as file:
 6     pickle.dump(a, file)
 7
 8 with open(‘text.txt‘, ‘rb‘) as file2:
 9     b = pickle.load(file2)
10
11 print(type(b))
12 print(b)

执行结果:

/usr/bin/python3.5 /home/rxf/python3_1000/1000/python3_server/python_pickle/example.py
<class ‘dict‘>
{‘age‘: ‘40‘, ‘ name ‘: ‘Tom‘}

2、一个列表info,用 pickle.dumps()方法将info序列化为string形式,而不是存入文件中。用pickle.loads()方法从string(文件名称data1)读出序列化前的对象。

 1 import pickle
 2 import pprint
 3
 4 info = [1, 2, 3, ‘abc‘, ‘ilovepython‘]
 5 print(‘原始数据:‘)
 6 pprint.pprint(info)
 7
 8 data1 = pickle.dumps(info)
 9 data2 = pickle.loads(data1)
10
11 print("序列化:%r" % data1)
12 print("反序列化: %r" % data2)

执行结果:

/usr/bin/python3.5 /home/rxf/python3_1000/1000/python3_server/python_pickle/demo1.py
原始数据:
[1, 2, 3, ‘abc‘, ‘ilovepython‘]
序列化:b‘\x80\x03]q\x00(K\x01K\x02K\x03X\x03\x00\x00\x00abcq\x01X\x0b\x00\x00\x00ilovepythonq\x02e.‘
反序列化: [1, 2, 3, ‘abc‘, ‘ilovepython‘]

Process finished with exit code 0

3、pickle模块主要函数实例

 1 # pickle模块主要函数的应用举例
 2 import pickle
 3 import pprint
 4
 5 dataList = [[8, 1, ‘python‘],
 6             [8, 1, ‘python‘],
 7             [8, 0, ‘python‘],
 8             [8, 1, ‘C++‘],
 9             [8, 1, ‘C++‘]]
10 dataDic = {0: [1, 2, 3, 4],
11            1: (‘a‘, ‘b‘),
12            2: {‘c‘: ‘yes‘, ‘d‘: ‘no‘}}
13 print("原始数据dataList:")
14 pprint.pprint(dataList)
15 print(‘\n‘)
16 print("原始数据dataDic:")
17 pprint.pprint(dataDic)
18
19 # 使用dump()将数据序列化到文件中
20 fw = open(‘dataFile.txt‘, ‘wb‘)
21 # Pickle the list using the highest protocol available.
22 pickle.dump(dataList, fw)
23 # Pickle dictionary using protocol 0.
24 pickle.dump(dataDic, fw)
25 fw.close()
26
27 # 使用load()将数据从文件中序列化读出
28 fr = open(‘dataFile.txt‘, ‘rb‘)
29 data1 = pickle.load(fr)
30 print(‘\n‘+"反序列化1:%r" % data1)
31 data2 = pickle.load(fr)
32 print("反序列化2:%r" % data2 + ‘\n‘)
33 fr.close()
34
35 # 使用dumps()和loads()举例
36 p = pickle.dumps(dataList)
37 print(pickle.loads(p))
38 p = pickle.dumps(dataDic)
39 print(pickle.loads(p))

执行结果:

/usr/bin/python3.5 /home/rxf/python3_1000/1000/python3_server/python_pickle/demo2.py
原始数据dataList:
[[8, 1, ‘python‘],
 [8, 1, ‘python‘],
 [8, 0, ‘python‘],
 [8, 1, ‘C++‘],
 [8, 1, ‘C++‘]]

原始数据dataDic:
{0: [1, 2, 3, 4], 1: (‘a‘, ‘b‘), 2: {‘c‘: ‘yes‘, ‘d‘: ‘no‘}}

反序列化1:[[8, 1, ‘python‘], [8, 1, ‘python‘], [8, 0, ‘python‘], [8, 1, ‘C++‘], [8, 1, ‘C++‘]]
反序列化2:{0: [1, 2, 3, 4], 1: (‘a‘, ‘b‘), 2: {‘d‘: ‘no‘, ‘c‘: ‘yes‘}}

[[8, 1, ‘python‘], [8, 1, ‘python‘], [8, 0, ‘python‘], [8, 1, ‘C++‘], [8, 1, ‘C++‘]]
{0: [1, 2, 3, 4], 1: (‘a‘, ‘b‘), 2: {‘d‘: ‘no‘, ‘c‘: ‘yes‘}}

Process finished with exit code 0

4、要注意的是,在load(file)时,要让python能够找到类的定义,否则会报错:

 1 import pickle
 2
 3
 4 class Person:
 5     def __init__(self, name, age):
 6         self.name = name
 7         self.age = age
 8
 9     def show(self):
10         print(self.name+"_"+str(self.age))
11
12 aa = Person("Battier", 6)
13 aa.show()
14
15 f = open(‘./demo3.txt‘, ‘wb‘)
16 pickle.dump(aa, f, 0)
17 f.close()
18
19 # del Person
20 f = open(‘./demo3.txt‘, ‘rb‘)
21 bb = pickle.load(f)
22
23 f.close()
24 bb.show()

如果不注释掉del Person的话,那么会报错:(意思就是当前的模块找不到类了)

/usr/bin/python3.5 /home/rxf/python3_1000/1000/python3_server/python_pickle/demo3.py
Battier_6
Traceback (most recent call last):
  File "/home/rxf/python3_1000/1000/python3_server/python_pickle/demo3.py", line 21, in <module>
    bb = pickle.load(f)
AttributeError: Can‘t get attribute ‘Person‘ on <module ‘__main__‘ from ‘/home/rxf/python3_1000/1000/python3_server/python_pickle/demo3.py‘>

Process finished with exit code 1

5、清空pickler的“备忘”,使用Pickler实例在序列化对象的时候,它会“记住”已经被序列化的对象引用,所以对同一对象多次调用dump(obj),pickler不会“傻呼呼”的去多次序列化。

 1 import pickle
 2 import io
 3
 4
 5 class Person:
 6     def __init__(self, name, age):
 7         self.name = name
 8         self.age = age
 9
10     def show(self):
11         print(self.name + "_"+str(self.age))
12
13 aa = Person("Battier", 6)
14 aa.show()
15
16
17 fle = io.BytesIO()
18 pick = pickle.Pickler(fle)
19 pick.dump(aa)
20 val1 = fle.getvalue()
21 print(len(val1))
22
23 pick.clear_memo()
24 pick.dump(aa)
25 val2 = fle.getvalue()
26 print(len(val2))
27 fle.close()

上面代码运行结果:

/usr/bin/python3.5 /home/rxf/python3_1000/1000/python3_server/python_pickle/demo4.py
Battier_6
69
138

Process finished with exit code 0

再注释掉pick.clear_memo()后,运行结果如下:

/usr/bin/python3.5 /home/rxf/python3_1000/1000/python3_server/python_pickle/demo4.py
Battier_6
69
74

Process finished with exit code 0

主要是因为,python的pickle如果不clear_memo,则不会多次去序列化对象。

时间: 2024-10-14 18:17:18

python3_pickle模块详解的相关文章

Python中time模块详解

在Python中,与时间处理有关的模块就包括:time,datetime以及calendar.这篇文章,主要讲解time模块. 在开始之前,首先要说明这几点: 在Python中,通常有这几种方式来表示时间:1)时间戳 2)格式化的时间字符串 3)元组(struct_time)共九个元素.由于Python的time模块实现主要调用C库,所以各个平台可能有所不同. UTC(Coordinated Universal Time,世界协调时)亦即格林威治天文时间,世界标准时间.在中国为UTC+8.DST

python中threading模块详解(一)

python中threading模块详解(一) 来源 http://blog.chinaunix.net/uid-27571599-id-3484048.html threading提供了一个比thread模块更高层的API来提供线程的并发性.这些线程并发运行并共享内存. 下面来看threading模块的具体用法: 一.Thread的使用 目标函数可以实例化一个Thread对象,每个Thread对象代表着一个线程,可以通过start()方法,开始运行. 这里对使用多线程并发,和不适用多线程并发做

ansible常用模块详解

ansible常用模块详解: ansible <host-pattern> [-m module_name] [-a args] [options] #ansible命令格式  指定主机组或ip地址  指定调用模块   传递给模块的参数   ansible-doc -l #列出可用模块 ansible-doc -s model_name #查看指定模块详细用法 command:ansible默认模块,对指定主机执行命令,不能理解特殊字符 例:ansible web -a 'date' #对we

nginx的配置及模块详解

nginx: nginx是俄罗斯软件工程师Igor Sysoev开发的免费开源web服务器软件,nginx采用了模块化.事件驱动.异步.单线程及非阻塞的架构,并大量采用了多路复用及事件通知机制来实现高并发和高性能,解决C10K的问题,主要功能就是提供http和反向代理服务,以及邮件服务及反向代理等,并且具有多种web服务器功能特性:负载均衡,缓存,访问控制,带宽控制,以及高效整合各种应用的能力. 在nginx中,连接请求由为数不多的几个仅包含一个线程的进程worker以高效的回环(run-loo

python的logging模块详解

日志级别 >>>import logging >>>logging.NOTSET 0 >>>logging.DEBUG 10 >>>logging.INFO 20 >>>logging.WARN 30 >>>logging.ERROR 40 >>>logging.CRITICAL 50 >>>logging._levelNames {0:'NOTSET', 10:

Ceph Monitor基础架构与模块详解

转自:https://www.ustack.com/blog/ceph-monitor/ Ceph rados cluster离不开Monitor,如果没有Monitor,则Ceph将无法执行一条简单的命令.Monitor由于其特殊性,了解它,对于我们深入理解Ceph,保证Ceph的稳定性,有很大帮助. Monitor 基本架构介绍 Monitor的基本架构图: Monitor的主要任务就是维护集群视图的一致性,在维护一致性的时候使用了Paxos协议,并将其实例化到数据库中,方便后续的访问.所以

nodejs QueryString模块 详解

QueryString模块 "QueryString" 模块用于实现URL参数字符串与参数对象的互相转换 此类一共包括4个方法: querystring.stringify(obj, [sep], [eq]) querystring.parse(str, [sep], [eq], [options]) querystring.escape querystring.unescape 一:querystring.stringify(obj,[sep],[eq]) 对象格式化成参数字符串 ,

(转)python time模块和datetime模块详解

python time模块和datetime模块详解 原文:http://www.cnblogs.com/tkqasn/p/6001134.html 一.time模块 time模块中时间表现的格式主要有三种: a.timestamp时间戳,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量 b.struct_time时间元组,共有九个元素组. c.format time 格式化时间,已格式化的结构使时间更具可读性.包括自定义格式和固定格式. 1.时间格式转换图: 2.主要ti

Ansible安装部署及常用模块详解

Ansible命令使用 Ansible语法使用ansible <pattern_goes_here> -m <module_name> -a <arguments> -m NAME,–module-name=NAME:指定执行使用的模块 -u USERNAME,–user=USERNAME:指定远程主机以USERNAME运行命令 -s,–sudo:相当于Linux系统下的sudo命令 -USUDO_USERNAME,–sudo-user=SUDO_USERNAME:使用