编码 decode & encode

import sys

# python3 中字符编码默认为 utf-8
s = ‘你好‘
print(s)

# utf-8 转为 gbk (s 默认为 unicode 所以可以直接 encode 成 gbk)
s_to_gbk = s.encode(‘gbk‘)
print(‘gbk‘, s_to_gbk)
print(‘default‘, s.encode())
print(‘bytes type‘, type(s))
print(‘system default‘, sys.getdefaultencoding())

# 将 gbk 再转为 utf-8 , 因为默认是 utf-8
# 所以需要先将 gbk encode 成 gbk 才能 encode 为 utf-8
gbk_to_utf8 = s_to_gbk.decode(‘gbk‘).encode(‘utf-8‘)
print(‘utf-8‘, gbk_to_utf8)

原文地址：https://www.cnblogs.com/PAYNE1Z/p/8966411.html

时间： 2024-08-30 11:39:47

编码 decode & encode的相关文章

Python编码介绍——encode和decode

在 python 源代码文件中,如果你有用到非ASCII字符,则需要在文件头部进行字符编码的声明,声明如下: # code: UTF-8 因为python 只检查 #.coding 和编码字符串,所以你可能回见到下面的声明方式,这是有些人为了美观等原因才这样写的: #-*- coding: UTF-8 -*- 常见编码介绍: GB2312编码:适用于汉字处理.汉字通信等系统之间的信息交换 GBK编码:是汉字编码标准之一,是在 GB2312-80 标准基础上的内码扩展规范,使用了双字节编码 ASC

decode encode

decode的作用是将其他编码的字符串转换成unicode编码, 如str1.decode('gb2312'),表示将gb2312编码的字符串转换成unicode编码. encode的作用是将unicode编码转换成其他编码的字符串, 如str2.encode('gb2312'),表示将unicode编码的字符串转换成gb2312编码.

x264代码剖析（三）：主函数main()、解析函数parse()与编码函数encode()

x264代码剖析(三):主函数main().解析函数parse()与编码函数encode() x264的入口函数为main().main()函数首先调用parse()解析输入的参数,然后调用encode()编码YUV数据.parse()首先调用x264_param_default()为保存参数的x264_param_t结构体赋默认值:然后在一个大循环中通过getopt_long()解析通过命令行传递来的存储在argv[]中的参数,并作相应的设置工作:最后调用select_input()和sele

x264源代码简单分析：宏块编码（Encode）部分

本文记录x264的 x264_slice_write()函数中调用的x264_macroblock_encode()的源代码.x264_macroblock_encode()对应着x264中的宏块编码模块.宏块编码模块主要完成了DCT变换和量化两个步骤. 函数调用关系图宏块编码(Encode)部分的源代码在整个x264中的位置如下图所示. 单击查看更清晰的图片宏块编码(Encode)部分的函数调用关系如下图所示. 单击查看更清晰的图片从源代码可以看出,宏块编码模块的x264_macrobl

Python3 关于UnicodeDecodeError/UnicodeEncodeError: ‘gbk’ codec can’t decode/encode bytes类似的文本编码问题

以下是小白的爬虫学习历程中遇到并解决的一些困难,希望写出来给后来人,如有疏漏恳请大牛指正,不胜感谢! 首先,我的代码是这样的 1 2 3 import requests 4 5 url = 'http://www.acfun.tv/' 6 html = requests.get(url) 7 8 print(html.text) python2中解决方法(题外话) 参考:http://www.cnblogs.com/zhaoyl/p/3770340.html 在前面加上以下代码即可 import

python 编码（encode）解码（decode）问题

s = '匆匆'print(s)s1 = s.decode("utf-8") # utf-8 转成 Unicode,decode(解码)需要注明当前编码格式print(s1,type(s1)) s2 = s1.encode("gbk") # unicode 转成 gbk,encode(编码)需要注明生成的编码格式print(s2,type(s2)) s3 = s1.encode("utf-8") # unicode 转成 utf-8,encode

python蛋疼的编码decode、encode、unicode、str、byte的问题都在这了

相信很多人和我一样,被python蛋疼的编码问题纠缠不清,比如下面的私以为出现这种错误的原因还是对一些基本的编解码概念不够熟悉,下面就说说我的理解: 首先python刚出来的时候unicode还没有一统江湖,期间很多代码和程序压根就是直接用ascii编码,反正代码都是英文写的,而且当时那个年代写代码一般都是说英文的,那就无所谓啦,人家用的爽才不care那么多,后来互联网开始兴起,全球各个地方的人都需要了,中国这边的话自己搞了套gbk(gb2312)编码,同时该编码包含了ascii,毕竟asci

python-网页乱码且decode encode均无效

在某个网页看到这么一句话:“大多数网站都对支持gzip压缩的浏览器做了gzip的压缩,在python中可以通过gzip包处理gzip压缩过的网页” 所以问题就是内容有压缩过,直接decode不行,需要用gzip来解压.然后再decode. import gzip ... html = gzip.decompress(response) html = html.decode('gbk') 用gb2312不行,用gbk却可以,因为gbk包含gb2312,所以可以知道的是网页源码有超出gb2312编码

2.8 decode encode

cat /Users/zrd/Downloads/gostandardlib/Chapter02/Strings and Things/recipe08/win1250.txt Gda?sk% decode package main import ( "io" "os" "golang.org/x/text/encoding/charmap" ) func main() { f, err := os.OpenFile("out.txt&