python_编码

交互式的默认编码是系统默认编码
脚本的默认编码是ANSCII （有其他非ANSCII字符如：中文会报错）
指定脚本的默认编码 # -*- coding: encoding -*-

Unicode 可以转 utf-8 和gbk
s_utf = s_uicode.encode(‘utf-8‘)

utf-8 和gbk 转Unicode
s_unicode = s_utf_8.encode(‘utf-8‘)

中文
Unicode           一个
Gbk              两个
Utf-8            三个

>>> gbk = ‘asdf五‘                 //当前默认的是gbk
>>> gbk
‘asdf\xce\xe5‘
>>> print gbk
asdf五
>>> len(gbk)
6
>>> unicode = gbk.decode(‘gbk‘)
>>> unicode
u‘asdf\u4e94‘
>>> print unicode
asdf五
>>> len(unicode)
5
>>> utf_8 = unicode.encode(‘utf-8‘)
>>> utf_8
‘asdf\xe4\xba\x94‘
>>> print utf_8
asdf五
>>> len(utf_8)
7

时间： 2024-08-06 09:04:36

python_编码的相关文章

python_判断字符串编码的方法

1. 安装chardet 在命令行中,进入Python27\Scripts目录,输入以下的命令:easy_install chardet 2. 操作 import chardet f = open('file','r') fencoding=chardet.detect(f.read()) print fencoding fencoding输出格式 {'confidence': 0.96630842899499614, 'encoding': 'GB2312'} ,只能判断是否为某种编码的概率.

python_字符编码&格式化

电脑最小储存单位是bit(位),8bit为一个Byte(字节), 8bit=1Byte 1024Byte=1KB 1024KB=1MB 1024MB=1GB 1024GB=1TB 编码的故事: 计算机是美国人发明的,最早只有127个字符编码,编码表被称为ASCII编码,中文怎么办?中国就把中文编进去,制定了GB2312编码,日本把日文编到Shift_JIS里,韩国把韩文编到Euc-kr里..............这样会出现什么情况,假如我一个本档的内容有中文,英文,显示就会乱码,我们说的乱码,

文件编码解读

1 lines (8 sloc) 333 Bytes 2 from urllib.request import urlopen 3 from bs4 import BeautifulSoup 4 5 html = urlopen("http://en.wikipedia.org/wiki/Python_(programming_language)") 6 bsObj = BeautifulSoup(html, "html.parser") 7 content = b

Python_网络编程_socket()

什么是 Socket? Socket又称"套接字",应用程序通常通过"套接字"向网络发出请求或者应答网络请求,使主机间或者一台计算机上的进程间可以通讯. 详细资料查看菜鸟教程http://www.runoob.com/python3/python3-socket.html 案例1 - 实现连接: 1.1服务端 # -*- coding: UTF-8 -*- # Filename : Python_网络编程_服务器端.py #引入模块 import socket,sy

《自拍教程56》Python_批量安装卸载1000个apk

接上2篇案例:Python_批量下载1000个apk, Python_批量验证1000个apk, 都下载完了, 也验证了下载文件的版本号和MD5后,就要开始批量安装了, 然后开始尝试运行打开这个app, 做最基本的功能检点,最后就要考虑卸载App了. 本篇内容主要介绍如何用Python来批量实现安装apk,卸载apk. 备注: 一个手机不可能同时安装1000个apk,需要考虑每50-100个作为一组,进行安装,验证后卸载测试. 准备阶段 adb install -d -r XXX.apk 是安装

Python中编码的详细讲解

看这篇文章前,你应该已经知道了为什么有编码,以及编码的种类情况 ASCII 占1个字节,只支持英文 GB2312 占2个字节,支持6700+汉字 GBK GB2312的升级版,支持21000+汉字 Shift-JIS 日本字符 ks_c_5601-1987 韩国编码 TIS-620 泰国编码由于每个国家都有自己的字符,所以其对应关系也涵盖了自己国家的字符,但是以上编码都存在局限性,即:仅涵盖本国字符,无其他国家字符的对应关系.应运而生出现了万国码,他涵盖了全球所有的文字和二进制的对应关系, U

java编码规范

右括号") "与其后面的关键字之间,关键字与其后面的左括号"("或"{"之间,以及"}"与"{"之间,要以一个空格隔开:除". "外,所有二元操作符的前.后要加空格:在逗号后边加一个空格. 说明: 一个紧跟着括号的关键词应该被空格分开: 空白应该位于参数列表中逗号的后面: 所有的二元运算符,除了".",应该使用空格将之与操作数分开.一元操作符和操作数之间不应该加空格,

微信实现定位城市并获取城市编码

最近在做一个项目是将用户的当前所在市县定位出来并展示在手机端页面,同时还要获取到该市县的城市编码从而进行数据过滤,这里重点讲定位城市及获取城市编码前端页面代码: 首先引用腾讯地图的一个js <script type="text/javascript" src="https://3gimg.qq.com/lightmap/components/geolocation/geolocation.min.js" ></script> 同时在页面加载

python字符编码

1. 字符编码简介阶段一:现代计算机起源于美国,最早诞生也是基于英文考虑的ASCII ASCII:一个Bytes代表一个字符(英文字符/键盘上的所有其他字符),1Bytes=8bit,8bit可以表示0-2**8-1种变化,即可以表示256个字符 ASCII最初只用了后七位,127个数字,已经完全能够代表键盘上所有的字符了(英文字符/键盘的所有其他字符) 后来为了将拉丁文也编码进了ASCII表,将最高位也占用了阶段二:为了满足中文,中国人定制了GBK GBK:2Bytes代表一个字符为了满