python 处理中文 读取数据库输出全是问号

ref:http://www.cnblogs.com/zhoujie/archive/2013/06/07/problem1.html

1、python连接mssql数据库编码问题

  python一直对中文支持的不好,最近老遇到编码问题,而且几乎没有通用的方案来解决这个问题,但是对常见的方法都试过之后,发现还是可以解决的,下面总结了常用的支持中文的编码问题(这些方法中可能其中一个就能解决问题,也可能是多个组合)。

  (1)、首先,要保证文件的开头要加上编码设置来说明文件的编码

#encoding=utf-8

  (2)、然后,在连接数据的连接参数里加上字符集说明查询出的结果的编码,这个不加的后果可能是查询出的汉字字符都是问号

conn=pymssql.connect(server=‘.‘,user=‘‘, password=‘‘,database=‘MyTest‘,charset=‘utf8‘)

  (3)、设置python系统的默认编码(对于文件来说,这招几乎屡试不爽,呵呵~~)

import sys
reload(sys)
sys.setdefaultencoding(‘utf8‘)

  注意:上述编码是“utf8”,而不是“utf-8”,我也没弄明白,大部分情况下,这个无所谓的,但是这里我试了必须要是“utf8”

  一个简单的完整的python连接mssqlserver的例子如下(得安装pymssql包):

 1 #encoding:utf8
 2 import sys
 3 reload(sys)
 4 sys.setdefaultencoding(‘utf8‘)
 5 import pymssql
 6 try:
 7     conn=pymssql.connect(server=‘.‘,user=‘‘, password=‘‘,database=‘MyTest‘,charset=‘utf8‘)
 8     sql="select * from UserInfo"
 9
10     cur=conn.cursor()
11     cur.execute(sql)
12     data=cur.fetchall()
13     conn.close()
14     print data15 except Exception,e:
16     print e

  运行结果如下:

[(u‘20093501‘, u‘\xb9\xf9\xbe\xb8‘, u‘\u7537 ‘, 35, u‘\xb4\xf3\xcf\xc0‘), (u‘20093502‘, u‘\xbb\xc6\xc8\xd8‘, u‘\u5973 ‘, 34, u‘\xc3\xc0\xc5\xae‘),  (u‘20093503‘, u‘\xc1\xee\xba\xfc\xb3\xe5‘, u‘\u7537 ‘, 25, u‘2B\xc7\xe0\xc4\xea‘),  (u‘20093504‘, u‘\xc8\xce\xd3\xaf\xd3\xaf‘, u‘\u5973 ‘, 24, u‘\xc6\xaf\xc1\xc1‘)]
 [Finished in 0.2s]

  虽然摆脱了问号和乱码的困扰,但这仍不是我们想要的结果,但这个确实是正确的,因为结果是utf8编码。这个现象确实诡异,请教了许多高手,得知,最好的结果就是逐个字段查询,才能显示中文,整个查询的话,会以utf8的格式显示出来。

  上述代码中第14行data是整个查询的结果,如果指定某个具体的字段,如print data[0][2](表示取查询结果的第一行第三列的字段的值),则会输出中文。

其实不仅仅是mssqlserver数据库,mysql(需下载MySQLdb包)、sqllite(python自带的文件数据库)、mongodb(需下载PyMongo包)等或者是普通文本文件也是类似的解决方案。

2、参数*args和和**kwargs

这是一个Python特性,类似C#和C++中的参数数组(param[]),允许函数接受动态的、可变数量的、参数名只在运行时可知的参数。 如果在函数定义时,只在参数前面加一个*号,所有传递给函数的参数将会保存为一个元组. 如果在函数定义时,在参数前面加两个*号,所有传递给函数的关键字参数,将会保存为一个字典

def foo(*args, **kwargs):
    print "Positional arguments are:"
    print args
    print "Keyword arguments are:"
    print kwargs

调用它,看看它是如何工作的:

>>> foo(1, 2, 3)
Positional arguments are:
(1, 2, 3)
Keyword arguments are:
{}
>>> foo(1, 2, name=‘Adrian‘, framework=‘Django‘)
Positional arguments are:
(1, 2)
Keyword arguments are:
{‘framework‘: ‘Django‘, ‘name‘: ‘Adrian‘}

原文地址:https://www.cnblogs.com/kaerxifa/p/8401772.html

时间: 2024-10-11 04:33:24

python 处理中文 读取数据库输出全是问号的相关文章

Python使用中文注释和输出中文(原创)

刚开始学习python,需要在Python中注释中文和输出中文,现在开始尝试: 仅为初步学习参考,高手请绕行. ----------------------------------------------------------------------- 第一步:在代码中输入以下命令,执行: #在Python中显示中文注释和输出中文a ="中文"print a 返回错误: d:\Python27\python.exe "D:\test\中文.py"Process s

python flask 如何读取数据库数据并返回到html

app.py from flask import Flask from flask import render_template from flask_bootstrap import Bootstrap import pymysql app = Flask(__name__) bootstrap = Bootstrap(app) @app.route('/') def index(): conn = pymysql.connect(host='*.*.*.*', user='root', pa

python读取数据库数据,读取出的中文乱码问题

最近遇到python读取数据库数据,读取出的中文乱码问题, 网络搜索的基本是: "1. Python文件设置编码 utf-8 (文件前面加上 #encoding=utf-8)2. MySQL数据库charset=utf-83. Python连接MySQL是加上参数 charset=utf84. 设置Python的默认编码为 utf-8 (sys.setdefaultencoding(utf-8)" 这些,一一尝试后仍未解决.去数据库查看了下,发现这个出现中文乱码的字段类型是varcha

python读取数据库中文乱码问题

今天朋友遇到过怪问题,在同一个页面显示的2条中文记录一个正常,一个乱码,2条记录分别从不同的表里取出.录入的时候采用直接录入.仔细观察2者区别,发现能正常显示的字段在表中类型为nvarchar,不能的是varchar,试着将其改成nvarchar,问题解决. 因为对sqlserver不熟悉.通过查询手册得知: nvarchar表示以Unicode格式存储可变长度的 数据,所以能显示中文,而varchar是用非unicode存储数据,所以乱码.将Varchar类型设置为nvarchar类型,发现问

python 读取数据库,老是报错。

在8.04.4环境下(其实我觉得跟环境无关,是我语句有问题): $ dpkg -l | grep -i python ii  libapache2-mod-python                 3.3.1-2build1               Apache 2 module that embeds Python within th ii  moinmoin-common                       1.5.8-5.1ubuntu2.5          Python

Python小程序,读取ACCESS数据库,然后list数据

曾经做过的一个Python小程序,读取ACCESS数据库,然后list数据 # -*- coding: cp936 -*-import wximport wx.libimport sys,glob,randomimport win32com.clientreload(sys)sys.setdefaultencoding('utf-8')class DemoFrame(wx.Frame): def __init__(self): wx.Frame.__init__(self,None,-1,u"安

Python下的OpenCV学习 02 —— 图像的读取与输出

OpenCV提供了众多对图片操作的函数,其中最基本的就是图片的读取与输出了. 一.读取图片 利用OpenCV读取一张图片是非常容易的,只需要用到 imread() 函数,我们进入IPython,输入help(cv2.imread)获取该函数的文档,得到: imread(...)     imread(filename[, flags]) -> retval 可见, imread需要提供两个参数,第一个是图片的路径,第二个是图片读取的模式(flags),函数返回一个存储着图片像素数据的矩阵. fl

python MySQLdb中文乱码

Python操作MySQL需要安装Python-MySQL可以从网上搜索一下,和一般的Python包一样安装 安装好之后,模块名字叫做MySQLdb ,在Window和Linux环境下都可以使用,试验了一下挺好用,不过又发现了烦人的乱麻问题,最后用了几个办法,解决了! 我用了下面几个措施,保证MySQL的输出没有乱麻:    1 Python文件设置编码 utf-8 (文件前面加上 #encoding=utf-8)    2 MySQL数据库charset=utf-8     3 Python连

python与中文的那点事

目录 python与中文的那点事 1. utf-8/gbk/unicode/ASCII 2.各种编码之间的转换 3. 统计字符串中数字,字母,汉字的个数 python与中文的那点事 在学习python的过程中,发现在python2与python3中对中文的处理有所不同,所以这篇文章就来探讨一下这些不同 1. utf-8/gbk/unicode/ASCII ??我们都知道,在计算机内部所有的信息都可以被表示成二进制的字符串,每一个二进制位有1和0两种状态,因此8位的二进制数可以表示256种状态,这