几天前的拼命coding碰到了很多问题,其中一个就是中国特色程序猿问题--中文编码乱码. 当我把写好的DAO模块测试CURD时,数据库执行正常,但是所有的字段中的中文全部乱码.我尝试了修改eclipse项目默认编码为UTF-8,尝试设置数据库的表的编码 alter table type character set utf8; 都无济于事. 自己曾经遇到过这种情况,但是没有整理过,到了用的时候,眉头一皱,计就是不上来. 折腾了半个钟头,终于找到了解决办法: 这里就忘了刚才的囧吧,咳咳,加入我们刚刚
中文编码问题是用中文的程序员经常头大的问题,在python下也是如此,那么应该怎么理解和解决python的编码问题呢? 我们要知道python内部使用的是unicode编码,而外部却要面对千奇百怪的各种编码,比如作为中国程序经常要面对的gbk,gb2312,utf8等,那这些编码是怎么转换成内部的unicode呢? 首先我们先看一下源代码文件中使用字符串的情况.源代码文件作为文本文件就必然是以某种编码形式存储代码的,python默认会认为源代码文件是asci编码,比如说代码中有一个变量赋值: s