python utf-8转化gbk

1. utf-8转化gbk

def ReadFile(filePath,encoding="utf-8"):
    with codecs.open(filePath,"r",encoding) as f:
        return f.read()
  
def WriteFile(filePath,u,encoding="gbk"):
    with codecs.open(filePath,"w",encoding) as f:
        f.write(u)
        
#def WriteFile(filePath,u,encoding="gbk"):
#    with codecs.open(filePath,"wb") as f:
#        f.write(u.encode(encoding,errors="ignore")) 
        
#def UTF8_2_GBK(src,dst):
#    content = ReadFile(src,encoding="utf-8")
#    WriteFile(dst,content,encoding="gbk")
    
def UTF8_2_GBK(src,dst):
    content = ReadFile(src,encoding="utf-8")
    WriteFile(dst,content,encoding="gb18030")
时间: 2024-10-31 18:37:23

python utf-8转化gbk的相关文章

python 读取中文CSV 'gbk' codec can't decode bytes in position 2-3:illegal multibyte sequence

读取中文的文档如Excel,CSV文件,需要中文编码 如gbk 解码才能转Unicode:然而 数据混合类型,读CSV文件就会出错,经管Excel正常. UnicodeDecodeError :'gbk' codec can't decode bytes in position 2-3:illegal multibyte sequence意思是:将一个字符串,通过gbk的方式,去解码,想要获得Unicode字符串,结果出错了 解决方法:处理的字符的确是gb2312,但是其中夹杂的部分特殊字符,是

Node.js转化GBK编码 - iconv-lite

node当使用node获取GBK编码的数据时,nodejs只支持utf-8,node没有提供转换编码的原生支持,有倒是有一个模块iconv能干这个事,但需要本地方法,VC++库的支持.国外有个大牛写了一个纯粹用Javascript解码的模块:iconv-lite,可以实现编码转换,使用方法如下: var http = require("http"); var iconv = require("iconv-lite"); var url = "http://

[python]UnicodeEncodeError: 'gbk' codec can't encode character 解决方法

在windows下面编写python脚本,编码问题很严重. 将网络数据流写入文件时时,我们会遇到几个编码: 1: #encoding='XXX' 这里(也就是python文件第一行的内容)的编码是指该python脚本文件本身的编码,无关紧要.只要XXX和文件本身的编码相同就行了. 比如notepad++ "格式"菜单里面里可以设置各种编码,这时需要保证该菜单里设置的编码和encoding XXX相同就行了,不同的话会报错 2:网络数据流的编码 比如获取网页,那么网络数据流的编码就是网页

【python】Python3中出现'gbk' codec can't encode characte的成功解决方法?

亲身测试,所遇问题完全解决!2018/07/08 21:37 环境:windows,Pycharm,python3.6.2 使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 这个问题. 网络上有很多类似的文件讲述如何解决这个问题,但是无非就是encode,decode相关的,这是导致该问题出现的真正原因吗

python学习笔记——叁

集合{  }  set 无序 元素不可重复 用set可以将 列表 转化为 集合 求 1和2都有的那部分 可以用符号   &     b = t & s 输出如下 4,6 并集 将1和2去重合并到一起 可以用符号  |   a = t | s 输出如下 差集 求1有但是2没有的那部分 就是集合1剪去都有的那部分 可以用符号  - c = t – s 输出 子集,父集求3是否是1的子集 issubset() 返回布尔 求1部否是3的父集 issuperset()返回布尔 对称差集 相当于1和2

初学python之day3

又学习新东西了,赶紧记下来. 一. python学习之对文件的读写操作 1-1 对文件的操作顺序: 1  变量 = open(...) 2 操作文件的读写 3 关闭文件 1-2 打开文件的模式 r,只读模式(默认). input = open('data', 'r')        也可写成  input = open('data') w,只写模式.(不可读:不存在则创建:存在则删除内容:)a,追加模式.(可读: 不存在则创建:存在则只追加内容:) "+" 表示可以同时读写某个文件:

python 数据提取之JSON与JsonPATH

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写.同时也方便了机器进行解析和生成.适用于进行数据交互的场景,比如网站前台与后台之间的数据交互. JSON和XML的比较可谓不相上下. Python 2.7中自带了JSON模块,直接import json就可以使用了. 官方文档:http://docs.python.org/library/json.html Json在线解析网站:http://www.json.cn/#

Python中文乱码

1,注意:请使用智慧型浏览器 "CHROME" 配合理解和运作本文中提到的程序. 2,提示:谷歌的CHROME浏览器是迄今为止最智慧的浏览器,没有之一,只有第一. 3,谷歌的CHROME浏览器最特殊的一点是:"根据字符集使用不同的后台智能解码程序". 4,本文内容请见红字部分: 使用办法为: 在文件中开头加入代码如下: #!/usr/bin/python  或 者  #!user/bin/env python # -*- coding: utf-8 -*-# -*-

paip.日志中文编码原理问题本质解决python

默认的python日志编码仅仅gbk...保存utf8字符错误..输出到个eric5的控制台十默认好像十unicode的,要是有没显示出来的字符,大概十字体问题..调整eric5的字体走ok兰. #调用封装 from log import * iniLog (r"c:\enPn2atiEnPh.log") logx("xxx") #主要的代码 设置文件编码为utf8 handler = logging.FileHandler(logfile, "a&quo