字符集编码选择

ci 表示校对时不区分大小写,相对的 cs 表示区分大小写。还有一个 bin 结尾的是
字节比较。而 general 是地区名,这里是通用,utf8 表示编码。
如果是 gbk,可以使用 gbk_chinese_ci,如果是 utf8 则用 utf8_general_ci
SHOW COLLATION LIKE ‘gbk%‘;
以 gbk 为例,gbk 有 gbk_chinese_ci 和 gbk_bin,排序,ci 不分区大小写,而 bin 是区分
的,导致最后排序不同。

例如,在不区分大小写的字符编码时候,数据库中的数据有 A a B c 。使用ORDDER BY letter ASC排序查询时,查询到的数据输出顺序为:a A B c。

在使用区分大小写编码排序数据有 A a B c 时候,输出顺序为 A B a c

时间: 2024-10-09 18:38:02

字符集编码选择的相关文章

字符集编码

http://blog.chinaunix.net/uid-20761674-id-3486843.html http://www.searchtb.com/2012/04/chinese_encode.html 编码问题的例子 在windows自带的notepad(记事本)程序中输入“联通”两个字,保存后再次打开,会发现“联通”不见了,代之以“???”的乱码.这是windows平台上典型的中文编码问题.即文件保存的时候是按照ANSI编码(其实就是GB2312,后面会详细介绍)保存,打开的时候程

你不知道的 字符集和编码(编码字符集与字符集编码)

我的上篇文章,有朋友提出字符集和编码的区别,我在此立文和大家讨论下 常说的字符集和编码区别,其实就是编码字符集和字符集编码的区别,其实,单单如果只是说字符集,没有任何编码的概念的话,那么字符集其实仅仅是一个简单的字符的集合,或者说是一个抽象的字符的集合,包括文字,符号等等,不参与任何存储形式,只是存在这么各种各样标准的字符的集合 如果仅仅是抽象的字符集,我们是无需拿出讨论的,因为没有任何异议,通俗易懂,而常说的字符集指的编码字符集,比如常见的 unicode.ascii.gb2312.gbk等,

Java的字符集编码入门

Java中的字符集编码入门(一)Unicode与UCS的历史恩怨 ASCII及相关标准 地球人都知道ASCII就是美国标准信息交换码的缩写,也知道ASCII规定用7位二进制数字来表示英文字符,ASCII被定为国际标准之后的代号为ISO-646.由于ASCII码只使用了7个二进制位,也就是说一个字节可以表示的256个数字中,它仅使用了0~127这128个码位,剩下的128个码位便可以用来做扩展,用来表示一些特定语言所独有的字符,因此对这多余的128个码位的不同扩展,就形成了一系列ISO-8859-

linux下mysql字符集编码问题的修改

安装完的MySQL的默认字符集为 latin1 ,为了要将其字符集改为用户所需要的(比如utf8),就必须改其相关的配置文件:由于linux下MySQL的默认安装目录分布在不同的文件下:不像windows一样放在同一目录下,只需修改其中的my.ini文件,重起后就生效了:所以先来看看linux下MySQL的数据库文件.配置文件和命令文件分别在不同的目录 : 1.数据库目录,其所创建的数据库文件都在该目录下 /var/lib/mysql/ 2.配置文件 (mysql.server命令及配置文件所在

Java字符集编码

1.概述 在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF编码就是"e4b8ad e69687".注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来"表示". 2.编码基础知识 最早的编码是iso8859-1,和ascii编码相似.但为了方便表示各种各样的语言,逐渐出现了很多标准编码,

Confluence 6 配置字符集编码

Confluence 和你的数据库必须配置使用相同的字符集.为了避免字符出现问题,请将所有的字符集设置为使用 UTF-8 编码(或者根据你配置的数据库来制定正确的 UTF-8 编码字符集,例如在 Oracle 中使用的是 AL32UTF8 ). 配置 Confluence 字符集编码 在默认的情况下,Confluence 使用的是 UTF-8  字符集编码.Confluence 中也有多个检查来确保你的数据库也是使用的 UTF-8 编码(或者对应的编码). 当然,你也是可以对你的字符集进行修改的

java 乱码 字符集编码

程序经常出现乱码怎么办?下面仔细说一下 首先计算机存储的一切都是字节,只认识字节,也就是一串的二进制数字. 而字符的存储是需要先通过字符集编码转换成可存储的"二进制数字".而出现乱码的原因基本上都是在这个阶段出现的.也就是通过字符集编码转换阶段.比如:'中'字符想存储到计算机上,需要先通过XX字符编码转换然后存储到计算机上,而在其他计算机(B)上读取的时候,因为计算机内部存储的是二进制,此时B计算机从硬盘上读取到二进制数值通过YY字符编码进行转换,然后显示,此时,如果XX编码与YY编码

Linux下MySQL5.6的修改字符集编码为UTF8

一.登录MySQL查看用SHOW VARIABLES LIKE 'character%';下字符集,显示如下: +--------------------------+----------------------------+ | Variable_name | Value | +--------------------------+----------------------------+ | character_set_client | utf8 | | character_set_conn

12月30日作业-<转>字符集编码

1.基础知识 计算机中储存的信息都是用二进制数表示的:而我们在屏幕上看到的英文.汉字等字符是二进制数转换之后的结果.通俗的说,按照何种规则将字符存储在计算机中,如'a'用什么表示,称为"编码":反之,将存储在计算机中的二进制数解析显示出来,称为"解码",如同密码学中的加密和解密.在解码过程中,如果使用了错误的解码规则,则导致'a'解析成'b'或者乱码. 字符集(Charset):是一个系统支持的所有抽象字符的集合.字符是各种文字和符号的总称,包括各国家文字.标点符号