python基础模块之序列化

---什么是序列化(picking)?

 我们把变量从内存中变成可存储或传输的过程称之为序列化。

 序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。

 反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。

 举例:大家应该都玩过魔兽争霸,应该知道该游戏有一个存档的功能,我每次不想玩得时候就可以存档,然后再玩得时候我们根本不需要重新开始玩,只需要读档就可以了。我们现在学习的事面向对象的思想,那么在我们眼中不管是我们的游戏角色还是游戏中的怪物、装备等等都可以看成是 一个个的对象,进行简单的分析。

角色对象(包含等级、性别、经验值、HP、MP等等属性) 
武器对象(包含武器的类型、武器的伤害、武器附加的能力值等等属性) 
怪物对象(包含等级、经验值、攻击、怪物类型等等) 
于是玩游戏过程变的非常有意思了,创建游戏角色就好像是创建了一个角色对象,拿到武器就好像创建了一个武器对象,遇到的怪物、NPC等等都是对象了。 
然后再用学 过的知识进行分析,我们发现对象的数据都是保存在内存中的,应该都知道内存的数据在断电以后是会消失的,但是我们的游戏经过存档以后,就算你关机了几天, 再进入游戏的时候,读取你的存档发现你在游戏中的一切都还在呢,奇怪了,明明内存中的数据已经没有了啊,这是为什么呢?于是再仔细考虑,电脑中有硬盘这个 东西在断电以后保存的数据是不会丢的(要是由于断电导致的硬盘损坏了,没有数据了,哈哈,不在此考虑中)。那么应该很容易的想到这些数据是被保存在硬盘中 了。没错!这就是对象的持久化,也就是我们今天要讲的对象的序列化。那么反序列化就很好理解了就是将存放在硬盘中的信息再读取出来形成对象。

---如何序列化?

  在python中提供了两个模块可进行序列化。分别是pickle和json。

pickle

  pickle是python中独有的序列化模块,所谓独有,就是指不能和其他编程语言的序列化进行交互,因为pickle将数据对象转化为bytes

>>> import pickle
>>> d=[1,2,3,4]
>>> pickle.dumps(d)
b‘\x80\x03]q\x00(K\x01K\x02K\x03K\x04e.‘
>>> type(pickle.dumps(d))
<class ‘bytes‘>     #类型为bytes

  pickle模块提供了四个功能:dumps、dump、loads、load。

  dumps和dump都是进行序列化,而loads和load则是反序列化。

 dumps

  dumps将所传入的变量的值序列化为一个bytes,然后,就可以将这个bytes写入磁盘或者进行传输。

  而dump则更加一步到位,在dump中可以传入两个参数,一个为需要序列化的变量,另一个为需要写入的文件。

 dump

  loads当我们要把对象从磁盘读到内存时,可以先把内容读到一个bytes,然后用loads方法反序列化出对象,也可以直接用load方法直接反序列化一个文件。

 loads

 load

json

  如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准格式,比如XML,但更好的方法是序列化为JSON,因为JSON表示出来就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,并且比XML更快,而且可以直接在Web页面中读取,非常方便。

  如果想要详细了解JSON的话,推荐一篇博文:http://www.cnblogs.com/mcgrady/archive/2013/06/08/3127781.html

  json中的方法和pickle中差不多,也是dumps,dump,loads,load。使用上也没有什么区别,区别在于,json中的序列化后格式为字符。

>>> import json
>>> d=[1,2,3,4]
>>> json.dumps(d)
‘[1, 2, 3, 4]‘
>>> type(json.dumps(d))
<class ‘str‘>           #类型为str

因为python中一切事物皆对象,所有对象都是基于类创建的,所以,‘类’在python中占据了相当大的比重。我们能否将类的实例进行序列化呢?

>>> class student(object):
...     def __init__(self,name,age,course):
...         self.name=name
...         self.age=age
...         self.course=course
...
>>> a=student(‘linghuchong‘,24,‘xixingdafa‘)
>>> import json
>>> json.dumps(a)
TypeError: <student object at 0x035B8230> is not JSON serializable

晕,竟然不能!现在几乎都是面向对象编程,类这么重要,竟然不能序列化,怎么搞?

不要着急,前面的代码之所以无法把student类实例序列化为JSON,是因为默认情况下,dumps方法不知道如何将student实例变为一个JSON的‘{}‘对象。

我们需要’告诉‘json模块如何转换。

>>> def st_to_dict(a):
...     return {‘name‘:a.name,‘age‘:a.age,‘course‘:a.course}
...
>>> print(json.dumps(a,default=st_to_dict))          #default参数就是告知json如何进行序列化
{"course": "xixingdafa", "name": "linghuchong", "age": 24}
    

当然,如果我们每定义一个类,还得再定义一下这个类的实例转换为字典的函数实在是太麻烦了!!我们有一个一劳永逸的办法。

print(json.dumps(a, default=lambda obj: obj.__dict__))

其中的__dict__不需我们在类中定义,因为通常class的实例都有一个__dict__属性,它就是一个字典,用来存储实例变量。

>>> print(a.__dict__)
{‘course‘: ‘xixingdafa‘, ‘age‘: 24, ‘name‘: ‘linghuchong‘}
时间: 2024-08-04 05:04:43

python基础模块之序列化的相关文章

python之模块 marshal(序列化)---没理解

# -*- coding: utf-8 -*- #python 27 #xiaodeng #python之模块 marshal(序列化) #来自:mldxs import marshal data1 = ['abc',12,23,'jb51'] data2 = {1:'aaa',"b":'dad'} data3 = (1,2,4) output_file = open("a.txt",'wb')#把这些数据序列化到文件中,注:文件必须以二进制模式打开 marshal

Python基础----模块2

sys模块 sys模块提供了一系列有关Python运行环境的变量和函数. 1 #重点记忆 2 sys.argv #命令行参数List,第一个元素是程序本身路径 3 sys.exit(n) #退出执行的程序未见,正常退出时exit(0),不同于循环用的break跳出循环 4 sys.path #返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值 5 6 #一般 7 sys.platform #返回操作系统平台名称 8 sys.version #获取Python解释程序的版本信息 9

Python基础(正则、序列化、常用模块和面向对象)-day06

写在前面 上课第六天,打卡: 天地不仁,以万物为刍狗: 一.正则 - - 在线正则工具:http://tool.oschina.net/regex/ - 二.序列化 - json - pickle 三.常用模块介绍 - time - random - os - sys - shutil - shelve - xml - configparser - hashlib - subprocess - logging - re - ... 四.面向对象 - 五.day06课后作业 题目要求: - 模拟实

python 基础 模块

---恢复内容开始--- 模块 Python 提供了一个办法,把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块 模块分为三种: 自定义模块 第三方模块 内置模块 自定义模块 模块导入 import 语句 想使用 Python 源文件,只需在另一个源文件里执行 import 语句,当解释器遇到 import 语句,如果模块在当前的搜索路径就会被导入 当我们使用import语句的时候,Python解释器的搜索路径是由一系列目录名组成的,Python解释器就依次从这些目

Python基础模块

OS模块: os.getcwd()  #获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname")  #改变当前脚本工作目录:相当于shell下cd os.curdir  #返回当前目录: ('.') os.pardir  #获取当前目录的父目录字符串名:('..') os.makedirs('dirname1/dirname2') #可生成多层递归目录 os.removedirs('dirname1')        #若目录为空,则删除,并递归到

python基础|模块---re模块

python中的re模块是正则技术中应用.对于正则就是正则表达式,正则表达式是独立一门技术,在各个编程体系都有它的“身影".在python中在爬虫技术中,数据分析,它都是必不可少的存在.主要利用正则表达式筛选字符串中我们需要的字符串类型数据. 正则表达式基础知识.元字符和量词. 元字符 匹配作用 . 可以匹配除换行符以外的任何字符 \w 匹配字母,数字和下滑线 \d 匹配除了数字 \s 匹配空格 \W 匹配非字母,数字和下划线 \D 匹配非数字 \S 匹配非空格 ^ 匹配^字符串开头.用法(^a

python基础-------模块与包(四)

configparser模块与 subprcess 利用configparser模块配置一个类似于 windows.ini格式的文件可以包含一个或多个节(section),每个节可以有多个参数(键=值). 配置成这样一个文件 [DEFAULT]ServerAliveInterval = 45Compression = yesCompressionLevel = 9ForwardX11 = yes [bitbucket.org]User = hg [topsecret.server.com]Por

python基础-------模块

在python中,只有函数,类,模块能开辟出作用域,for循环跟while循环,还有if语句是不能开辟作用域的 模块:模块就是.py文件 1,时间模块:time模块 1 import time 2 #1时间戳:是一个float类型 3 print(time.time()) #从1970年1月1日0点0分,到目前走了多少秒 4 #1493189111.495058 5 6 #2格式化时间字符串: 给人看的 7 print(time.strftime("%Y-%m-%d %X")) #%Y

Python 基础 - 模块 Module - os模块

OS模块 操作系统功能, 涉及文件及目录等操作.不受平台限制.os模块允许一个程序不需要任何改动,同时在linux 和 windows下运行.和windows下powershell以及linux里的command操作类同. 常用操作 os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") 改变当前脚本工作目录:相当于shell下cd os.curdir 返回当前目录: ('.') os.pardir 获取当前目录的父目录字