最近,我在做一个项目的部署,这个项目是已nginx为前端代理两个tomcat的节点,通过mysql-proxy代理访问两台主从的mysql数据库。
整个项目搭建部署完成,进行测试,发现打开网页出现中文乱码。好吧,我进行修改。
开始以为是mysql数据库配置有问题,查看mysql的配置文件my.conf,内容如下:
[mysqld] datadir=/usr/local/mysql/data socket=/tmp/mysql.sock user=mysql skip-character-set-client-handshake init_connect=‘SET NAMES utf8‘ default-storage-engine=INNODB [mysqld_safe] log-error=/var/log/mysqld.log pid-file=/var/run/mysqld/mysqld.pid default-character-set = utf8 [mysql] default-character-set = utf8 [mysql.server] default-character-set = utf8 [client] default-character-set = utf8
我在网上查找告诉我要在配置文件添加character-set-server=utf8和init_connect=‘SET NAMES utf8‘,我对配置文件就行更改
[mysqld] datadir=/usr/local/mysql/data socket=/tmp/mysql.sock user=mysql skip-character-set-client-handshake init_connect=‘SET NAMES utf8‘ character_set_server=utf8 default-storage-engine=INNODB [mysqld_safe] log-error=/var/log/mysqld.log pid-file=/var/run/mysqld/mysqld.pid default-character-set = utf8 [mysql] default-character-set = utf8 [mysql.server] default-character-set = utf8 [client] default-character-set = utf8
重新启动mysql,登录mysql数据库进行查询
查看默认字符集
mysql> show variables like ‘character_set%‘; +--------------------------+--------------------------------------------------------------------+ | Variable_name | Value | +--------------------------+--------------------------------------------------------------------+ | character_set_client | utf8 | | character_set_connection | utf8 | | character_set_database | utf8 | | character_set_filesystem | binary | | character_set_results | utf8 | | character_set_server | utf8 | | character_set_system | utf8 | | character_sets_dir | /usr/local/mysql-5.0.96-linux-x86_64-glibc23/share/mysql/charsets/ | +--------------------------+--------------------------------------------------------------------+ 8 rows in set (0.00 sec) mysql> show variables like ‘collation_%‘; +----------------------+-----------------+ | Variable_name | Value | +----------------------+-----------------+ | collation_connection | utf8_general_ci | | collation_database | utf8_general_ci | | collation_server | utf8_general_ci | +----------------------+-----------------+ 3 rows in set (0.00 sec) mysql>
看到所有的字符集都是utf8,心想这次应该没有问题了,结果打开网页还是出现乱码,
查看jdbc的接口的配置,
jdbc.url=jdbc:mysql://mysqlproxy:3306/canyin_model?useUnicode=true&characterEncoding=utf-8 jdbc.username=username jdbc.password=password
发现jdbc的配置也是utf8,也没有问题啊。
我检查了tomcat的配置文件,以为是server.xml文件忘记修改字符集,我打开server.xml文件,发现这配置如下:
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8" maxThreads="1000" minSpareThreads="100" acceptCount="1000" maxConnections="1000" maxHttpHeaderSize="8192" tcpNoDelay="true" compression="on" compressionMinSize="2048" enableLookups="false" />
发现我已经设置ugf-8字符集啊,怎么还是不对,看到这个结果一脸懵逼的样子,哎,问题还是要解决的,我向我朋友请教,他告诉我要在配置文件中添加useBodyEncodingForURI="true"我也不知道啊这是干啥的,在网上查找才知道。
Tomcat7中,get与post的处理是分开的,对get请求使用URIEncoding进行处理,对post使用request.setCharacterEncoding()处理。在server.xml的Connector元素增加了以下配置参数:
URIEncoding:用来设定通过URI传递的内容使用的编码,Tomcat将使用这里指定的编码对客户端传送的内容进行编码。处理get请求使用该参数,默认使用iso-8859-1编码。
useBodyEncodingForURI:使用与body一样的编码来处理URI。
好吧,对tomcat配置文件进行更改,
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" useBodyEncodingForURI="true" URIEncoding="UTF-8" />
重启tomcat,清除浏览器的缓存,再次访问还有乱码,在网页进行更改后,发现数据库的数据是正常的。访问的到时候,有时候还是会出现问号,不是乱码。这次乱码是解决了。
我朋友告诉我查看系统的字符集,我发现系统的字符集的好像有问题,
[[email protected] ~]# locale LANG=zh_CN.UTF-8 LC_CTYPE="zh_CN.UTF-8" LC_NUMERIC="zh_CN.UTF-8" LC_TIME="zh_CN.UTF-8" LC_COLLATE="zh_CN.UTF-8" LC_MONETARY="zh_CN.UTF-8" LC_MESSAGES="zh_CN.UTF-8" LC_PAPER="zh_CN.UTF-8" LC_NAME="zh_CN.UTF-8" LC_ADDRESS="zh_CN.UTF-8" LC_TELEPHONE="zh_CN.UTF-8" LC_MEASUREMENT="zh_CN.UTF-8" LC_IDENTIFICATION="zh_CN.UTF-8" LC_ALL= [[email protected] ~]# echo $LANG zh_CN.UTF-8 [[email protected] ~]# cat /etc/sysconfig/i18n LANG="zh_CN.UTF-8" [[email protected] ~]#
在LC_ALL这项为空,就对系统字符集进行更改,
echo "export LANG=\"zh_CN.UTF-8\" export LC_ALL=\"zh_CN.UTF-8\"" >> /etc/profile source /etc/profile
在查看系统都是utf8格式的,心想现在应该没有事了吧。打开网页,可以正常访问,但是,还是出现问号,几率还是比较大,再次查找原因。我猜想是不是proxy出现问题,于是我将节点直接连接到mysql数据库上,发现访问的时候没有问号出现。 但是proxy的配置没有关于字符集的配置啊,这是我朋友问我用的数据库的版本是多少,我告诉他mysql的版本为mysql-5.0.96。
于是告诉我查看mysql的配置文件,他看的我的配置文件,告诉我要在配置文件中的[mysqld]下加入default-character-set = utf8,更改内容如下:
[mysqld] datadir=/usr/local/mysql/data socket=/tmp/mysql.sock user=mysql skip-character-set-client-handshake init_connect=‘SET NAMES utf8‘ character_set_server=utf8 default-character-set=utf8 default-storage-engine=INNODB [mysqld_safe] log-error=/var/log/mysqld.log pid-file=/var/run/mysqld/mysqld.pid default-character-set = utf8 [mysql] default-character-set = utf8 [mysql.server] default-character-set = utf8 [client] default-character-set = utf8
加上以后,再次访问发现网页不在出现问号。
到此,我这个项目的乱码问题才算完美解决。
可为啥我配置的character_set_server=utf8不管用,而这default-character-set=utf8的配置管用吗?
我在度娘上查找,才明白。
原来在5.1版本时,为了解决中文乱码问题设置默认字符集为utf8时,在my.ini内的 [mysql] 和 [mysqld] 项中都是写:
default-character-set=utf8
到了5.5版本, [mysql] 项内可以这么写, [mysqld] 项内不能再这么写了,而是必须写:
character-set-server=utf8
而我的mysql数据库的版本为5.0的,所以只有配置default-character-set=utf8这个才管用。
总结:
1、MYSQL乱码的问题主要有几个环节决定,一个是前端网页;二是字符传输;三是连接MYSQL;四是MYSQL的存贮方式。
2、linux的要注意版本的区别。