1、python2和python3区别常用整理
# python2print ‘abc‘# 返回一个列表range()# 返回一个生成器值,不是list。每次只生成一个值,避免暂用很大的内存xrange() # 生成器# 输入raw_input(...) # python3print(‘abc‘)# 返回一个迭代值,需要生成列表就需要使用list(range(...))range()input(...)
2、复制 == 比较值是否相等 is 比较,比较的是内存地址 id(内容)
>>> li1 = [1,2,3] >>> li2 = li1 >>> pring(id(li1),id(li2)) >>> print(id(li1),id(li2)) 2472533256584 2472533256584 # 数字和字符串存在小数池,小数池范围内,使用的是同一个内存地址 # 数字 -5~256 >>> i1 = 6 >>> i2 = 6 >>> print(id(i1),id(i2)) 140717920019440 140717920019440 >>> i1 = 300 >>> i2 = 300 >>> print(id(i1),id(i2)) 2472536947344 2472536947248 >>> i1 = 256 >>> i2 = 256 >>> print(id(i1),id(i2)) 140717920027440 140717920027440 >>> i2 = 257 >>> i1 = 257 >>> print(id(i1),id(i2)) 2472536947344 2472536947248 >>> i1 = -5 >>> i2 = -5 >>> print(id(i1),id(i2)) 140717920019088 140717920019088 >>> i2 = -6 >>> i1 = -6 >>> print(id(i1),id(i2)) 2472536947344 2472536947248
# 字符串: 1、不能有特殊字符 # 2、s*20 还是同一个地址,s*21以后都是两个地址(有待考证,试验时,* 1以上,都变化了。估计是版本不同导致) >>> s1 = ‘121212asdasdasdadasdasdasdadadqrjladksfjaiodfu‘ >>> s2 = ‘121212asdasdasdadasdasdasdadadqrjladksfjaiodfu‘ >>> print(id(s1),id(s2)) 2472537146064 2472537146064 >>> s1 = ‘[email protected]‘ >>> s2 = ‘[email protected]‘ >>> print(id(s1),id(s2)) 2472537146160 2472537146064 # list、dict、tuple、set # list >>> l1 = [1,] >>> l2 = [1,] >>> print(l1 is l2) False >>> >>> l2 = l1 >>> print(l1 is l2) True
3、字符集编码
ascii A : 00000010 8位 一个字节 unicode A : 00000000 00000001 00000010 00000100 32位 四个字节 中:00000000 00000001 00000010 00000110 32位 四个字节 utf-8 A : 00100000 8位 一个字节 中 : 00000001 00000010 00000110 24位 三个字节 gbk A : 00000110 8位 一个字节 中 : 00000010 00000110 16位 两个字节1,各个编码之间的二进制,是不能互相识别的,会产生乱码。2,文件的储存,传输,不能是unicode(只能是utf-8 utf-16 gbk,gb2312,asciid等) py3: str 在内存中是用unicode编码。 bytes类型 对于英文: str :表现形式:s = ‘beer‘ 编码方式: unicode bytes :表现形式:s = b‘beer‘ 编码方式: utf-8 gbk。。。。 对于中文: str :表现形式:s = ‘熊大‘ 编码方式: unicode bytes :表现形式:s = b‘\xe9\x9b\x84\xe5\xa4\xa7‘ 编码方式: utf-8 gbk。。。。
>>> s = ‘beer‘ >>> s1 = b‘beer‘ >>> print(s,type(s)) beer <class ‘str‘> >>> print(s1,type(s1)) b‘beer‘ <class ‘bytes‘> >>> >>> >>> s = ‘雄大‘ >>> print(s,type(s) ) 雄大 <class ‘str‘> >>> s1 = b‘雄大‘ SyntaxError: bytes can only contain ASCII literal characters. >>> >>> >>> s1 = s.encode(‘utf-8‘) >>> print(s1) b‘\xe9\x9b\x84\xe5\xa4\xa7‘ >>> s1 = s.encode(‘gbk‘) >>> print(s1) b‘\xd0\xdb\xb4\xf3‘
原文地址:https://www.cnblogs.com/zxw-xxcsl/p/11577576.html
时间: 2024-10-08 10:05:18