编码 decode & encode

import sys

# python3 中字符编码默认为 utf-8
s = ‘你好‘
print(s)

# utf-8 转为 gbk (s 默认为 unicode 所以可以直接 encode 成 gbk)
s_to_gbk = s.encode(‘gbk‘)
print(‘gbk‘, s_to_gbk)
print(‘default‘, s.encode())
print(‘bytes type‘, type(s))
print(‘system default‘, sys.getdefaultencoding())

# 将 gbk 再转为 utf-8 , 因为默认是 utf-8
# 所以需要先将 gbk encode 成 gbk 才能 encode 为 utf-8
gbk_to_utf8 = s_to_gbk.decode(‘gbk‘).encode(‘utf-8‘)
print(‘utf-8‘, gbk_to_utf8)

  

原文地址:https://www.cnblogs.com/PAYNE1Z/p/8966411.html

时间: 2024-08-30 11:39:47

编码 decode & encode的相关文章

Python编码介绍——encode和decode

在 python 源代码文件中,如果你有用到非ASCII字符,则需要在文件头部进行字符编码的声明,声明如下: # code: UTF-8 因为python 只检查 #.coding 和编码字符串,所以你可能回见到下面的声明方式,这是有些人为了美观等原因才这样写的: #-*- coding: UTF-8 -*- 常见编码介绍: GB2312编码:适用于汉字处理.汉字通信等系统之间的信息交换 GBK编码:是汉字编码标准之一,是在 GB2312-80 标准基础上的内码扩展规范,使用了双字节编码 ASC

decode encode

decode的作用是将其他编码的字符串转换成unicode编码, 如str1.decode('gb2312'),表示将gb2312编码的字符串转换成unicode编码. encode的作用是将unicode编码转换成其他编码的字符串, 如str2.encode('gb2312'),表示将unicode编码的字符串转换成gb2312编码.

x264代码剖析(三):主函数main()、解析函数parse()与编码函数encode()

x264代码剖析(三):主函数main().解析函数parse()与编码函数encode() x264的入口函数为main().main()函数首先调用parse()解析输入的参数,然后调用encode()编码YUV数据.parse()首先调用x264_param_default()为保存参数的x264_param_t结构体赋默认值:然后在一个大循环中通过getopt_long()解析通过命令行传递来的存储在argv[]中的参数,并作相应的设置工作:最后调用select_input()和sele

x264源代码简单分析:宏块编码(Encode)部分

本文记录x264的 x264_slice_write()函数中调用的x264_macroblock_encode()的源代码.x264_macroblock_encode()对应着x264中的宏块编码模块.宏块编码模块主要完成了DCT变换和量化两个步骤. 函数调用关系图 宏块编码(Encode)部分的源代码在整个x264中的位置如下图所示. 单击查看更清晰的图片 宏块编码(Encode)部分的函数调用关系如下图所示. 单击查看更清晰的图片 从源代码可以看出,宏块编码模块的x264_macrobl

Python3 关于UnicodeDecodeError/UnicodeEncodeError: ‘gbk’ codec can’t decode/encode bytes类似的文本编码问题

以下是小白的爬虫学习历程中遇到并解决的一些困难,希望写出来给后来人,如有疏漏恳请大牛指正,不胜感谢! 首先,我的代码是这样的 1 2 3 import requests 4 5 url = 'http://www.acfun.tv/' 6 html = requests.get(url) 7 8 print(html.text) python2中解决方法(题外话) 参考:http://www.cnblogs.com/zhaoyl/p/3770340.html 在前面加上以下代码即可 import

python 编码(encode)解码(decode)问题

s = '匆匆'print(s)s1 = s.decode("utf-8") # utf-8 转成 Unicode,decode(解码)需要注明当前编码格式print(s1,type(s1)) s2 = s1.encode("gbk") # unicode 转成 gbk,encode(编码)需要注明生成的编码格式print(s2,type(s2)) s3 = s1.encode("utf-8") # unicode 转成 utf-8,encode

python蛋疼的编码decode、encode、unicode、str、byte的问题都在这了

相信很多人和我一样,被python蛋疼的编码问题纠缠不清,比如下面的 私以为出现这种错误的原因还是对一些基本的编解码概念不够熟悉,下面就说说我的理解: 首先python刚出来的时候unicode还没有一统江湖,期间很多代码和程序压根就是直接用ascii编码,反正代码都是英文写的,而且当时那个年代写代码一般都是说英文的,那就无所谓啦,人家用的爽才不care那么多,后来互联网开始兴起,全球各个地方的人都需要了,中国这边的话自己搞了套gbk(gb2312)编码,同时该编码包含了ascii,毕竟asci

python-网页乱码且decode encode均无效

在某个网页看到这么一句话:“大多数网站都对支持gzip压缩的浏览器做了gzip的压缩,在python中可以通过gzip包处理gzip压缩过的网页” 所以问题就是内容有压缩过,直接decode不行,需要用gzip来解压.然后再decode. import gzip ... html = gzip.decompress(response) html = html.decode('gbk') 用gb2312不行,用gbk却可以,因为gbk包含gb2312,所以可以知道的是网页源码有超出gb2312编码

2.8 decode encode

cat /Users/zrd/Downloads/gostandardlib/Chapter02/Strings and Things/recipe08/win1250.txt Gda?sk% decode package main import ( "io" "os" "golang.org/x/text/encoding/charmap" ) func main() { f, err := os.OpenFile("out.txt&