集合+字符编码

集合及关系运算

  1. 用途:关系运算,去重
  2. 定义方式:s={},花括号内用逗号隔开多个元素,每一个元素都必须是不可变类型。

    强调:

  1. 集合内的元素无序
  2. 集合内的元素不能改变
  3. 集合内的元素必须是不可变元素

    单纯的用集合去重:

  1. 去重的目标所包含的值必须都为不可变型
  2. 去重的集合会打乱原来的顺序

    优先掌握的操作

  1. 长度len
  2. 成员运算 in和not in
  3. 合集|
  4. 四交集&
  5. 差集-
  6. 对称差集
  7. ==
  8. 父集
  9. 子集

    内置方法:

    .add

    .pop

    .remove

    .clear

    .copy

    .difference

    .discard

    .isdisjoint

    字符编码

  1. 什么是字符编码

    将人类的字符编码转变成计算机能是别的数字。这种转换必须遵循一套固定的标准,该标准无非是人类字符与数字的对应关系,称之为字符编码表

    bit:二进制位

    Bytes:字节

    ASCII码表:用一个Bytes表示一个英文字符

    GBK:用两个Bytes表示一个中文字符,用一个Bytes表示一个英文字符

    unicode:内存中使用的是unicode编码,unicode把全世界的字符都建立好关系,用两个Bytes去表示字符

    utf-8用一个Bytes表示英文字符,用三个Bytes表示中文

    字符编码

  1. 内存中固定使用unicode编码,我们唯一可以改变的是存储到硬盘时候的编码
  2. 要想保证存取文件不乱码,应该保证当初是以什么编码格式存的,就应该以什么编程格式解码

    unicode=====》编码======gbk

    Unicode《====解码=======gbk

  3. Python3默认解释器 utf-8

    Python2默认解释器ASCII

    文件头

    #coding:utf-8

    在python2中有两种字符串编码格式

  1. Unicode

    X:’上’

  2. unicode编码后的结果:

    X=’上’如果文件头为cond:utf-8 ,那么在成utf-8格式的字符串

    在python3中

    X=‘上’

    x只有进行编码

    X.encode

    总结

    在python3中的字符串类型str都是unicode编码的

    在Python2中的字符串类型str都是unicode按文件头的指定编码,编码后的结果

    Python2中也可以制造出unicode编码的字符串,需要早字符串潜在u

    在python3中的字符串类型str都是unicode编码,所以python3中的字符串可以编码成其他编码格式,编码的结果是bytes类型

原文地址:https://www.cnblogs.com/zhangrenguo/p/9130996.html

时间: 2024-09-30 05:49:37

集合+字符编码的相关文章

第二章 集合 字符编码

集合 定义:有一个或多个确定的元素所构成的整体叫做集合. 特征: 1. 确定性(元素必须可hsah) 2. 互异性(去重) 3. 无序性(集合中的元素没有先后之分) 集合存在的意义就在于去重和关系运算 集合的创建: s = {} 创建一个字典 s = {1} 创建一个集合 集合的关系运算 交集 取出两个集合中共有的元素 s.intersection(s1) s & s1 差集 s.difference(s1) s - s1 从s中把s1中有的元素都去掉,通俗来讲就是:你有的我通通不要. 并集 s

元祖/集合/字符编码

元祖:该类型总结:/存多个值/有序/不可变 特点:不能改,只能取/但是元祖里面的列表可以改type:tuple1 用途:记录多个值,当多个值没有改的需求,此时用元组更合适2 定义方式:在()内用逗号分隔开多个任意类型的值t=(1,1.3,'xx',('a','b'),[1,2]) #t=tuple((1,1.3,'xx',('a','b'),[1,2]))3.常用操作+内置的方法1.按索引取值(正向取+反向取):只能取a=(1,2,3,4,5)print(a[0:4])#(1, 2, 3, 4)

列表/元组/字符串/字典/集合/文件/字符编码

1. 列表.元组操作 列表是我们最以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储.修改等操作 定义列表 1 names = ['Alex',"Tenglan",'Eric'] 通过下标访问列表中的元素,下标从0开始计数 1 2 3 4 5 6 7 8 >>> names[0] 'Alex' >>> names[2] 'Eric' >>> names[-1] 'Eric' >>> names[-2] #

Python——day3_基础1_集合,文件操作,字符编码与转码

集合 集合是一个无序的,不重复的数据组合,它的主要作用如下: 去重,把一个列表变成集合,就自动去重了 关系测试,测试两组数据之前的交集.差集.并集等关系 常用操作 s = set([3,5,9,10]) #创建一个数值集合 t = set("Hello") #创建一个唯一字符的集合 a = t | s # t 和 s的并集 b = t & s # t 和 s的交集 c = t – s # 求差集(项在t中,但不在s中) d = t ^ s # 对称差集(项在t或s中,但不会同时

python 全栈 python基础 (五)三元运算 字符编码 元组 集合 三级菜单优化!

三元运算 条件判断不能加冒号: a=3 b=5 c=a if a<b else b oct() 转成八进制的简写:16进制 标志:BH为后缀或是0x为前缀hex() 转成16进制 元组 跟列表是一样一样的!但它是只读列表,没有更改的权限! dir() 把传入的数据类型的,所有方法以列表的形式返回.作用: 明确的表示 元组里存储的数据是不应该被修改的!!! list(tuple元组) 变成列表 tuple(list列表) 变成元组 集合 setlinux ={"","&q

python集合、文件处理、字符编码

1. 集合操作 : 去重 {1, 2, 3, 4, 5, 6, 7, 8, 9} 1 list1 = [1,2,3,4,5,5,6,7,8,9] 2 list1 = set(list1) 3 print(list1) 1.1 集合语法里有个intersection是求两个集合之间的交集 1 list1 = [1,2,3,4,5,5,6,7,8,9] 2 list1 = set(list1) 3 print(list1) 4 5 list2 = set([0,1,2,3,44,44,55,555,

Python之路-python(set集合、文本操作、字符编码 )

一.集合操作(set)                                                                                                                                                                                             1.定义: set集合,是一个无序且不重复的元素集合. 集合对象是一组无序排列的可哈希的值,集合成员

python Day3 集合 文件处理 函数 字符编码 递归 高级函数

集合 集合是一个无序的,不重复的数据组合,它的主要作用如下: 去重,把一个列表变成集合,就自动去重了 关系测试,测试两组数据之前的交集.差集.并集等关系 常用操作 s = set([3,5,9,10]) #创建一个数值集合 t = set("Hello") #创建一个唯一字符的集合 a = t | s # t 和 s的并集 b = t & s # t 和 s的交集 c = t – s # 求差集(项在t中,但不在s中) d = t ^ s # 对称差集(项在t或s中,但不会同时

python学习笔记(集合的使用、文件操作、字符编码与转码、函数)

集合 集合(set):把不同的元素组成一起形成集合,是python基本的数据类型. 集合元素(set elements):组成集合的成员 为什么需要集合? 集合的作用 1 .列表去重复数据 按照现有知识的解决思路:先设置空列表,然后使用for寻获,把需要去重的列表的第一个数据放到新列表中,然后依次取出第二个数据,把第二个数据和第一个数据作比较,如果不一样,则存入新列表中:以此类推,每取一次都要和新列表中的数据作对比,不一样的则添加入新列表中. 2. 关系测试 比如有学员同时报了python班和l