mysql之字符集与校对集

一、字符集

1.mysql的字符集设置非常灵活

可以设置服务器默认字符集;

数据库默认字符集;

表默认字符集;

列字符集;

如果某一级别没有指定字符集,则继承上一级。

查看所有字符集语句:show character set;

2.以表声明为utf-8为例,最终存储在表中的数据为utf-8

①我们要告诉服务器,我给你发送的数据是什么编码?character_set_client

②告诉字符集转换器,转换成什么编码?character_set_connection

③查询的结果用什么编码?character_set_results

如果以上三者都为字符集N,可简写为set names N;

3.什么情况下会出现乱码呢?

我们首先创建一个测试表指定表的字符集为utf8

create table temp(

name varchar(10)

) charset utf8;   //charset utf8;决定了服务器的编码

然后执行这三条命令:

set character_set_client=gbk;

set character_set_connection=gbk;

set_character_set_results=gbk; 这三句可以简写为set names gbk;

最后往表里插入一条数据:

insert into temp values(‘中国‘);

select * from temp;这时候显示的结果是正常的。

当我们再执行这句命令时:set character_results=utf8;

出现乱码了,如图:

由此可得出当返回的结果result的字符集与客户端的字符集不符的时候会出现乱码。

还有一种情况也会出现乱码:client声明与事实不符时,你客户端明明是utf8,你却非要叫我转成gbk的,如下图:

可能还有很多种情况,这里没有一一列举。

4.什么情况下会造成数据的丢失呢?

执行这三条语句:

set character_set_client=gbk;

set character_set_connection=latin1;

set character_set_results=gbk;

再往表里插入一条数据:insert into temp values(‘美国‘);

最后查询的时候结果如下图:

数据丢失了。

由此可得出当connection和服务器的字符集比client小时,会造成数据的丢失,可能用语不是很准确,但是能理解即可以了。个人理解,就跟java里面不同数据类型相互转换时一样,比如把double类型强制转换成int类型,就会造成精度的丢失一样。

。。。。。。    

ag:

旧服务器,类似于谷歌等,服务器使用的编码是gbk或者是gb2312 ,现在开发的页面使用的都是utf8,如何才能保证数据的不丢失

解决:其中connection可以设置为gbk或者utf8都可以

二、校对集

如果有a B c D按照asc排序,此时默认排序后的结果还是a B c D ,并不是按照ASCII排序的

什么是校对集?

校对集:指字符集的排序规则。

查看所有校对集语句:show collation;

一种字符集可以有一个或多个排序规则。

show collation like ‘utf8%‘;将显示所有关于utf8的校对集

以utf8为例,默认是使用utf8_general_ci校对集,也可以按二进制来排,utf8_bin

怎样声明校对集?

create table tableName

(

  ...

)charset utf8 collate utf8_general_ci;

注意:声明的校对集必须是字符集合法的校对集。比如你字符集是utf8,你不能声明gbk的校对集。

时间: 2024-12-26 23:49:52

mysql之字符集与校对集的相关文章

mysql之全球化和本地化:字符集、校对集、中文编码问题

本文内容: 什么是字符集?什么是校对集? 查看字符集和校对集 设置字符集和校对集 mysql中的中文数据问题 首发日期:2018-04-19 什么是字符集?什么是校对集? 字符集是字母和符号的集合,每一个字符编码都由字符集决定. 校对集是字母和符号的校对标准.校对集影响着字符的排序和搜索. 查看字符集和校对集: 查看mysql支持的字符集:show character set; 查看mysql支持的校对集:show collation; 查看服务端默认的字符集:show variables li

21_字符集与校对集

字符集与校对集 create table 表名( 列声明 )charset utf8; 上面这个charset utf8指定服务器字符类型. ----------------------------------------------- 字符集: mysql的字符集设置非常灵活. 可以设置服务器默认字符集, 可以设置数据库默认字符集, 表默认字符集, 列字符集, 如果某一个级别没有指定字符集,则继承上一级. 1.告诉服务器,我给你发的数据是什么编码的?set character_set_clie

MySQL的字符集(Character Set)和校对集(Collate)

遇到一个创建数据库的SQL语句 CREATE DATABASE testdb DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; 注意:这里指定字符集是用utf8,而不是utf-8. 对上面的SQL语句中的CHARACTER SET 和 COLLATE产生了兴趣. 简单来说,CHARACTER SET是指字符集,而COLLATE是指校对集(可以理解为排序规则). 1.Character Set 1.1.字符集的4个层次 mysql4.1及其之后

mysql概要(九)字符集和校对集

1.mysql 字符集有细致设置: 2.mysql字符处理机制是:数据库和客户端之间存在一个字符集转换器(后文简称转换器)将客户端字符编码(必须告诉服务端的)转换成一种中间编码的数据(可自定义的但保证转换不会丢失数据),然后再转换成数据库定义的编码,取数据时,转换器将中间编码转换为需要的返回编码(可自定义). 设置通知服务端客户端的字符编码类型 3.出现乱码和丢失的情况 其实上面的所说编码,包括编码和解码. 查询支持的字符集种类: 4.校对集:对字符进行排序规则.一种字符集可有多种校对集. 4.

mysql字符集和校对规则(Mysql校对集)

字符集的概念大家都清楚,校对规则很多人不了解,一般数据库开发中也用不到这个概念,mysql在这方便貌似很先进,大概介绍一下简要说明 字符集和校对规则 字符集是一套符号和编码.校对规则是在字符集内用于比较字符的一套规则. MySql在collation提供较强的支持,oracel在这方面没查到相应的资料. 不同字符集有不同的校对规则,命名约定:以其相关的字符集名开始,通常包括一个语言名,并且以_ci(大小写不敏感)._cs(大小写敏感)或_bin(二元)结束 校对规则一般分为两类: binary

Mysql字符集以及校对规则

编码:计算机都是二进制存储,因此需要将显示符号转换成二进制数才能存储,每个字符所转换成的二进制数,就是字符编码. 字符集 字符用于显示的抽象符号.字符集是一套字符与字符编码的集合. 常见的字符集编码: Ascii字符集,GB2312字符集,gbk字符集,latin1字符集,unicode字符集等. show character set;可以获得MySQL支持的所有字符集. 修改数据库字符集 alter database liguodong character set utf8; MySQL可以使

Mysql中校对集utf8_unicode_ci与utf8_general_ci的区别

一直对utf8_unicode_ci与utf8_general_ci这2个校对集很迷惑,今天查了手册有了点眉目.不过对中文字符集来说采用utf8_unicode_ci与utf8_general_ci时有何区别还是不清楚? 下面摘录一下Mysql 5.1中文手册中关于utf8_unicode_ci与utf8_general_ci的说明: 当前,utf8_unicode_ci校对规则仅部分支持Unicode校对规则算法.一些字符还是不能支持.并且,不能完全支持组合的记号.这主要影响越南和俄罗斯的一些

mysql中的字符集和校对规则(mysql校对集)

1.简要说明介绍 字符集和校对规则 字符集是一套符号和编码.校对规则是在字符集内用于比较字符的一套规则. MySql在collation提供较强的支持,oracel在这方面没查到相应的资料. 不同字符集有不同的校对规则,命名约定:以其相关的字符集名开始,通常包括一个语言名,并且以_ci(大小写不敏感)._cs(大小写敏感)或_bin(二元)结束 校对规则一般分为两类: binary collation,二元法,直接比较字符的编码,可以认为是区分大小写的,因为字符集中'A'和'a'的编码显然不同.

mysql字符集与校对规则---大小写敏感那点事

在关系型数据库中,oracle/sql_server/db2都有对数据进行区分大小写,不过mysql有点奇怪,对数据不区分大小写,详细情况请看下面解析. MySQL在Linux下数据库名.表名.列名.别名大小写的默认规则是这样的: 1.数据库名与表名是严格区分大小写的. 2.表的别名是严格区分大小写的. 3.列名与列的别名在所有的情况下均是忽略大小写的. 4.字段内容(即数据)默认情况下是大小写不敏感的. 5.变量名(函数和存储过程)也是严格区分大小写的. 所以不禁我们就会想去修改,而控制这些的