第二十天,pickle json xml shelve configparser模块

今日内容

1.pcikle

  专用于python语言的序列化

2.json

  是一种跨平台的数据格式

  也属于序列化的一种方式

3.xml

  可拓展标记语言

  一种编写文档的语法 也支持跨平台

  比较json而言 属于重量级

4.shelve

  及其简单的序列化模块 只用于python

5 confiqparser

  配置文件解析模块

一 pickle

pickle是一个用来序列化的模块

序列化是什么?

指的是将内存中的数据结构转化为一种中间格式 并存储到硬盘上

反序列化是什么?

将硬盘上存储的中间格式数据再还原为内存中的数据结构

为什么要学序列化?

就是为了将数据持久存储

之前学过的文件也能完成持久化存储 但是操作起来非常麻烦

pickle模块主要功能

dump   序列化

load  反序列化

dumps

loads

不带s得死帮你封装write read  更方便

load函数可以多次执行  每次load 都是往后再读一个对象 如果没有了就抛出异常Ran out of input

import pickle
#用户注册后得到的数据
name = ‘高跟‘’
password = ‘123’
height = 1.5
hobby = [‘吃‘,‘喝’,‘赌’,‘飘’,{1,2,3}】

pickle支持python中所有的数据类型

user = {"name":name,"password":password,"height":height,"hobby":hobby,"test":3}  

序列化的过程
with open("userdb.pkl","ab") as f:
  userbytes = pickle.dumps(user)
  f.write(userbytes)

反序列化的过程

with open(‘userdb.pkl‘,‘rb‘) as f:

  userbytes = f.read()

  user = pickle.loads(userbytes)

  print(user)

  print(type(user))

dump 直接序列化到文件

with open("userdb.pkl","ab")as f:

  pickle.dump(user,f)

# #load 从文件反序列化
with open("userdb.pkl","rb") as f:
user = pickle.load(f)
print(user)
print(pickle.load(f))
print(pickle.load(f))
print(pickle.load(f))

二 shelve模块

shelve 模块  也用于序列化

它于pickle 不同之处在于  不需要关心文件模式什么的 直接把它当成一个字典来看待

它可以直接对数据进行修改  而不用覆盖原来的数据

而pickle 你想要修改只能  用wb模式来覆盖

import shelve
use = {‘name‘:‘高根‘}
s = shelve.open(‘userdb.shv‘)
s[‘user‘] = user
s.close()

s = shelve.open(‘userdb.shv‘,writeback=True)
print(s[‘user‘])
s[‘user‘][‘user‘])
s[‘user‘][‘age‘]=20
s.close()

三 jison模块(******)

  pickle 和 shevle 序列化后得到的数据 只有Python才能解析

  通常企业开发不可能做一个单机程序 都需要联网进行计算机间的交互

  我们必须保证这个数据 能够跨平台使用

  JSON是什么? jave script object notation 就是的对象表示法

  var obj = {"name":"egon")

  对于我们开发而言 json 就是一种通用的数据格式 任何语言都能解析

  js中的数据类型  Python数据类型

  {}        字典

  []        list

  string""      str""or‘‘

  int/float      int/float

  true/false     True/False

  null         None

  json格式的语法规范  

  最外层通常是一个字典或者列表

  { }或[ ]

  只要你想写一个json格式的数据 那么最外层直接写()

  字符串必须是双引号

  可以再里面套任意多的层次

  json核心功能

  dump

  dumps

  load

  loads

  不带s 封装 write 和read

import json

# 反序列化
# with open("a.json","rt",encoding="utf-8") as f:
#     res = json.loads(f.read())
#     print(type(res))

# with open("a.json",encoding="utf-8") as f:
#     print(json.load(f))

# 直接解析字符串的json为python对象

jsontext = """{
    "users": [{
            "name": "agon",
            "age": 68
        },
        {
            "name": "agon",
            "age": 68
        }
    ]
}"""

# res = json.loads(jsontext)
# print(res)

mydic = {
    "users": [{
        "name": "agon",
        "age": 68
    },
        {
            "name": "agon",
            "age": 68
        }
    ]
}
# with open("b.json","wt",encoding="utf-8") as f:
#     f.write(json.dumps(mydic))

# with open("b.json", "wt", encoding="utf-8") as f:
#     json.dump(mydic, f)

import json

# dic = {"a": ‘理查德姑妈‘, "b": "找到你", "c": "看不见的客人"}
# with open("c.json","wt",encoding="utf-8") as f:
#     f.write(json.dumps(dic))
# print(repr(s), type(s))

# with open("c.json","rt",encoding="utf-8") as f:
#     # print(f.read())
#     d = json.loads(f.read())
#     print(d)

练习

把news.json中的新闻数据 提取出来打印控制台

import json

with open("news.json","rt",encoding="utf-8") as f:
    res = json.load(f)
    print(type(res))
    for dic in res["result"]["data"]:
        for key in dic:
            print("%s:%s" % (key, dic[key]))

四 XML

XML 可扩展的标记语言
<></>
也是一种通用的数据格式
之所用用它也是因为跨平台

学习的重点还是语法格式
一、任何的起始标签都必须有?一个结束标签。
<> </>
二、可以采用另一种简化语法,可以在一个标签中同时表示起始和结束标
签。这种语法是在?于符号之前紧跟一个斜线(/),XML
解析器会将其翻译成<百度百科词条></百度百科词条>。
例例如<百度百科词条/>。

三、标签必须按合适的顺序进?行行嵌套,所以结束标签必须按镜像顺序匹配
起始标签。这好?比是将起始和结束标签看作是数学中的左右括号:在没有关闭所有
的内部括号之前,是不不能关闭外?面的括号的。
四、所有的特性都必须有值。
五、所有的特性都必须在值的周围加上双引号。

一个标签的组成部分
<tagename 属性名称="属性值">文本内容
</tagname>

单标签的写法
<tagename 属性名称="属性值"/>

# 镜像关闭顺序实例
<a>
<b>
<c>
</c>
</b>
</a>

把你左右同学的信息写成xml
<studentinfo>
<张三>
<age>20</age>
<gender>man</gender>
</张三>
<李四>
<age>20</age>
<gender>man</gender>
</李四>
</studentinfo>

总结 xml也是一种中间格式 也属于序列化方式之一
与json相比较
同样的数据 json会比xml 更小 效率更高
xml 需要根据文档结构 手动解析 而json 直接转对象

import xml.etree.ElementTree as ElementTree
# 解析d.xml
tree = ElementTree.parse("d.xml")
print(tree)
# 获取根标签
rootTree = tree.getroot()

# 三种获取标签的方式
# 获取所有人的年龄 iter是用于在全文范围获取标签
# for item in rootTree.iter("age"):
#     # 一个标签三个组成部分
#     print(item.tag) # 标签名称
#     print(item.attrib) # 标签的属性
#     print(item.text) # 文本内容

# 第二种 从当前标签的子标签中找到一个名称为age的标签  如果有多个 找到的是第一个
# print(rootTree.find("age").attrib)
# 第三种 从当前标签的子标签中找到所有名称为age的标签
# print(rootTree.findall("age"))

# 获取单个属性
stu = rootTree.find("stu")
print(stu.get("age"))
print(stu.get("name"))

# 删除子标签
rootTree.remove(stu)

# 添加子标签
# 要先创建一个子标签
newTag = ElementTree.Element("这是新标签",{"一个属性":"值"})
rootTree.append(newTag)

# 写入文件
tree.write("f.xml",encoding="utf-8")

五 configparser模块

  config parser

  用于解析配置文件的模块

  何为配置文件

  包含配置程序信息的文件就称为配置文件

  什么样的数据应作为配置信息

  需要改  但是不经常改的信息  例如数据文件的路径  DB_PATH

  

  配置文件中 只有两种内容

  一种是section 分区

  一种是option 选项 就是一个key=value形式

  我们通常使用的就是get 功能 用来从配置文件获取一个配置选项

  练习

  做一个登陆 首先查看配置文件 是否有包含 用户名和密码 如果由直接登陆  如果没有就进行输入用户名密码登录

  登陆=成功后 询问是否保存密码 如果是  写入配置文件

import configparser
# 创建一个解析器
config = configparser.ConfigParser()
# 读取并解析test.cfg
config.read("test.cfg",encoding="utf-8")
# 获取需要的信息
# 获取所有分区
# print(config.sections())
# 获取所有选项
# print(config.options("user"))
# 获取某个选项的值
# print(config.get("path","DB_PATH"))
# print(type(config.get("user","age")))
#
# # get返回的都是字符串类型 如果需要转换类型 直接使用get+对应的类型(bool int float)
# print(type(config.getint("user","age")))
# print(type(config.get("user","age")))

# 是否由某个选项
config.has_option()
# 是否由某个分区
# config.has_section()

# 不太常用的
# 添加
# config.add_section("server")
# config.set("server","url","192.168.1.2")
# 删除
# config.remove_option("user","age")
# 修改
# config.set("server","url","192.168.1.2")

# 写回文件中
# with open("test.cfg", "wt", encoding="utf-8") as f:
# config.write(f)

原文地址:https://www.cnblogs.com/gongcheng-/p/9807024.html

时间: 2024-07-31 22:34:03

第二十天,pickle json xml shelve configparser模块的相关文章

xml和configparser模块

一.xml模块 xml是实现不同语言或程序之间进行数据交换的协议,跟json差不多,但json使用起来更简单, 但至今很多传统公司如金融行业的很多系统的接口还主要是xml. xml的格式如下,就是通过<>节点来区别数据结构的: <?xml version="1.0"?> <data> <country name="Liechtenstein"> <rank updated="yes">2

PYDay10&amp;11&amp;12-常用模块:time|datetime|os|sys|pickle|json|xml、字符串格式化、py自动全局变量

1.py文件自动创建的全局变量 print(vars()) 返回值:{'__name__': '__main__', '__package__': None, '__loader__': <_frozen_importlib_external.SourceFileLoader object at 0x0000025471756E10>, '__cached__': None, '__doc__': None, '__file__': 'C:/Users/john/PycharmProjects

8.模块介绍 time &amp;datetime模块 random os sys shutil json &amp; picle shelve xml处理 yaml处理 configparser hashlib subprocess logging模块 re正则表达式

本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve xml处理 yaml处理 configparser hashlib subprocess logging模块 re正则表达式 模块,用一砣代码实现了某个功能的代码集合. 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能来,可能需要多个函数才能完成(函数又可以在不同的.p

Python自动化运维之10、模块之json、pickle、XML、PyYAML、configparser、shutil

序列化 Python中用于序列化的两个模块 json     用于[字符串]和 [python基本数据类型] 间进行转换 pickle   用于[python特有的类型] 和 [python基本数据类型]间进行转换 Json模块提供了四个功能:dumps.dump.loads.load pickle模块提供了四个功能:dumps.dump.loads.load json模块 # json()将字符串形式的列表或字典转换为list或dict类型,json是所有语言相互通信的方式# 注意外层字符形式

模块 序列化 json pickle shelv xml

序列化 序列化是指把内存里的数据类型转变成字符串,以使其能存储到硬盘或通过网络传输到远程,因为硬盘或网络传输时只能接受bytes. json 模块 json.dump(d,f) json.load(f) #与文件得交互 dump(可多次,但不那样做) load(只可一次) 把数据类型转成字符串存到内存里得意义? json.dumps(data) json.loads(q) #与内存得交互 1.把内存数据 通过网络 共享给远程其他人 必须:bytes 2.定义了不同语言之间得交互规则 2.1 纯文

pickle\json,configparser,hashlib模块

python常用模块 目录 python常用模块 json模块\pickle模块 configparser模块 hashlib模块 subprocess模块 json模块\pickle模块 首先说一下序列化和反序列化 . 序列化:将数据内容转化成一种特定的格式. 反序列化:将特定的格式在转化成数据内容. 其实我们之前学过序列化和反序列化的方法,即将内存中的数据转化为字符串的格式存进文件中,在从文件中利用eval()的方法反序列化出来.这也是一种方法,但是现在有更方便的方法. json模块是个序列

Python hash、xml、configparser、sheve、shutil模块讲解 以及 面向对象初识

今日内容: 1.hash模块2.xml模块3.configparser模块4.sheve 模块5.shutil模块 知识点一:hash什么是hash: hash是一种算法,该算法接受传入的的内容,经过运算得到一串hash如果把hash算法比喻一座工厂 那传给hash算法的内容就是原材料,生产的hash值就是生产出的产品 为何用hash算法: hash值产品有三大特性: 1.只要传入的内容一样,得到的hash值必然是一样的 2.只要我们使用的hash算法固定,无论传入的内容有多大得到的hash值得

处理xml模块、configparser模块、hashlib模块、subprocess模块

xml模块 新建a.xml内容为: <data> <country name="Liechtenstein"> <rank updated="yes">2</rank> <year updated="yes" version="1.0">2009</year> <gdppc>141100</gdppc> <neighbor d

Python常用模块——序列化pickle&amp;json模块

Python常用模块--序列化pickle&json模块 一.什么叫序列化? 序列化是指把内存里的数据类型转变成字符串,以使其能存储到硬盘或通过网络传输到远程,因为硬盘或网络传输时只能接收bytes. 二.为什么要序列化? 你打游戏过程中,打累了,停下来,关掉游戏,想过2天再玩.2天之后,游戏从你上次停止的地方继续运行,你上次游戏的进度肯定保存在硬盘上了,是以何种形式呢?游戏过程中产生的很多临时数据是不规律的,可能在你关掉游戏时正好有10个列表,3个嵌套字典的数据集合在内存里,需要存下来,你如何