utf8和utf8mb4的区别

一、简介

MySQL在5.5.3之后增加了这个utf8mb4的编码，mb4就是most bytes 4的意思，专门用来兼容四字节的unicode。好在utf8mb4是utf8的超集，除了将编码改为utf8mb4外不需要做其他转换。当然，为了节省空间，一般情况下使用utf8也就够了。

二、内容描述

那上面说了既然utf8能够存下大部分中文汉字,那为什么还要使用utf8mb4呢? 原来mysql支持的 utf8 编码最大字符长度为 3 字节，如果遇到 4 字节的宽字符就会插入异常了。三个字节的 UTF-8 最大能编码的 Unicode 字符是 0xffff，也就是 Unicode 中的基本多文种平面(BMP)。也就是说，任何不在基本多文本平面的 Unicode字符，都无法使用 Mysql 的 utf8 字符集存储。包括 Emoji 表情(Emoji 是一种特殊的 Unicode 编码，常见于 ios 和 android 手机上)，和很多不常用的汉字，以及任何新增的 Unicode 字符等等(utf8的缺点)。

来源：https://www.cnblogs.com/cuiqq/p/11045487.html

原文地址：https://www.cnblogs.com/gao88/p/12101285.html

时间： 2024-10-15 20:15:20

utf8和utf8mb4的区别的相关文章

MySQL utf8 和 utf8mb4 的区别

utf-8 时变化长度的编码,储存一个code point 需要1~4个字节. 然而,mysql的utf8只存储最多3个字节per code point. 所以,utf8字符集不能存储所有的unicode code points. 只能从0x000 to 0xFFFF(叫做Basic Multilingual Plane:BMP) The character set named utf8 uses a maximum of three bytes per character and contai

utf8和utf8mb4的具体区别有哪些？

一.简介 MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode.utf8mb4是utf8 的超集,除了将编码改为utf8mb4外不需要做其他转换.当然,为了节省空间,一般情况下使用utf8也就够了. 二.内容描述那上面说了既然utf8能够存下大部分中文汉字,那为什么还要使用utf8mb4呢? 原来mysql支持的 utf8 编码最大字符长度为 3 字节,如果遇到 4 字节的宽字符就会插入异常了.三个字节的 UT

UTF-8 GBK UTF8 GB2312之间的区别和关系

UTF-8 GBK UTF8 GB2312之间的区别和关系 UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM.是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码.UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强.UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示.如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包.

[转]ASCII UNICODE与UTF-8编码规则及区别

字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得一点字符编码的知识. 1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出 256种状态,这被称为一个字节(byte).也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从 0000000到11111111. 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一

ASCII，Unicode，GBK和UTF-8字符编码的区别联系

ASCII,Unicode,GBK和UTF-8字符编码的区别联系 wyrssktzc11级分类:其他被浏览86次2016.05.27 检举 KingSta逍遥采纳率:45%7级2016.05.27 ASCII.Unicode.GBK和UTF-8字符编码的区别联系很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物.他们看到8个开关状态是好的,于是他们把这称为"字节".再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出

mysql中utf8和utf8mb4区别

MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode.好在utf8mb4是utf8的超集,除了将编码改为utf8mb4外不需要做其他转换.当然,为了节省空间,一般情况下使用utf8也就够了. 二.内容描述那上面说了既然utf8能够存下大部分中文汉字,那为什么还要使用utf8mb4呢? 原来mysql支持的 utf8 编码最大字符长度为 3 字节,如果遇到 4 字节的宽字符就会插入异常了.三个字节的 UTF-8 最

utf8和utf8mb4区别

原文链接一.简介 MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode.好在utf8mb4是utf8的超集,除了将编码改为utf8mb4外不需要做其他转换.当然,为了节省空间,一般情况下使用utf8也就够了. 二.内容描述那上面说了既然utf8能够存下大部分中文汉字,那为什么还要使用utf8mb4呢? 原来mysql支持的 utf8 编码最大字符长度为 3 字节,如果遇到 4 字节的宽字符就会插入异常了.三个字

gbk、utf-8、utf8mb4区别

1. 存储大小(1). GBK编码专门用来解决中文编码的,是双字节的.不论中英文都是双字节的.(2). UTF-8 编码是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码.对于英文字符较多的网站则用UTF-8 节省空间.(3). utf-8mb4支持4个字节的存储,如emoji表情 2. 范围(1). GBK包含全部中文字符:(2). UTF-8则包含全世界所有国家需要用到的字符.(3). utf8mb4专门用来兼容四字节的unicode.ut

Convert.ToBase64String(Byte[])和Encoding.UTF8.GetString(Byte[])的区别

Encoding.UTF8.GetString是针对使用utf8编码得到的字符串对应的byte[]使用,可以还原我们能看懂的字符串而Convert.ToBase64String是对任意byte[]都可使用,得到的是用字符串表示的byte[]信息内容类似"Jwl9Kh+lPfmSPio//UpvbA==" Base64有个优点,就是可以用文本格式传输,base64绝对不存在任何不可读的字符,也不存在关键字冲突字符,不需要转义.缺点:Base64比起它的原始文本增大约30%. 二者都是将

猜你喜欢

我的学习之路_第八章_map集合

[Map集合] Map集合中常用方法: 1: 返回值:value值 put(K key, V value) 往Map集合中添加元素,如果key值重复,那么将返回被覆盖的value值. 2: 返回值:v ...

控制器-各种ActionResult

<1> MVC笔记 Controller相关技术 using System; using System.Collections.Generic; using System.Linq; us ...

0521.使用UIWebView加载来自NetWork、Project、Documents的html、javascript文件

话不多少,直接上代码,思路还是挺简单的. UIWebView *webView = [[UIWebView alloc]initWithFrame:self.view.frame]; // HTML文 ...

Metadata Service 架构详解 - 每天5分钟玩转 OpenStack（165）

下面是 Metadata Service 的架构图,本节我们详细讨论各个组件以及它们之间的关系. nova-api-metadata nova-api-metadata 是 nova-api 的一个子 ...

情怀还值几毛钱?

前段时间锤子手机出了个T1的一周年纪念版,因为一直没有深度用过我锤,就买了部用了用,但从目前的安卓手机市场来看,2480的售价加200的碎屏险还是偏贵的,但是为了情怀嘛. 手机扎扎实实的用了2个月,感 ...

CSS美化自己的完美网页

CSS美化自己的完美网页 CSS概述 css样式: css是英文Cascading Style Sheets的缩写,称为层叠样式表,用于对页面进行美化,CSS的可以使页面更加的美观.基本上所有的htm ...

15.3获取DataGridView的当前单元格的索引和内容

using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; usin ...

求js和php怎样生成随机数，0到1之间的，保留两位小数点。

js 随机数 <script language="javascript">var num=Math.random();var newNum =num.toFixed(2 ...

同步多域名dig

#!/usr/bin/env python import dns.resolver class Mydig: def __init__(self): self.data = {} de ...

Objective-C 观察者模式--KVO和NSNotificationCenter的使用

Objective-C中的KVO和NSNotificationCenter的原理是观察模式的很好实现, 下面用代码分别演示下用法 KVO的用法 1 - (void)viewDidLoad { 2 [s ...

spring MVC注解深入研究

@Controller @Service @Controller和 @Component注册一个action 到spring 上下文中,bean 的ID 默认为类名称开头字母小写.@Reposito ...

boost::implicit_cast

在C++中有四种类型转换 1.static_cast:这个是最经常使用的类型转换.凡是C++隐式执行的类型转换都能够用static_cast显式完毕.在隐式转换时有时编译器会有警告信息.可是显示转换就 ...

css写三角

.container{ position: relative; width: 200px; height: 200px; background: #abcdef; -webkit-border-rad ...

DIV+CSS:如何编写代码才能更有效率

如何编写CSS代码才能更有效率?这是许多网页制作者与开发者都关心的问题.大概没有什么魔法,可以保证一下就把你的样式表缩小到百分之多少,但合理的 CSS 编码与组织技巧,的确能够帮助你的更有效率地写出更 ...

某个企业自己的利益

http://baozoumanhua.com/users/13462660/followingshttp://baozoumanhua.com/users/13462676/followingsht ...

跨域Meta格式

跨域meta头格式所有: <meta http-equiv="Access-Control-Allow-Origin" content="*"> ...

DevExpress v15.1：WinForms控件功能升级（五）

<免费下载DevExpress Winforms Controls v15.1.5> WinForms Snap Reporting 数据源向导 Snap新的数据源向导简化了在运行时绑定S ...

Currency Exchange（Bellman-ford)

Currency Exchange Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 21349 Accepted: 765 ...

套现还能买房？

近日,网上一则关于女子变卖北京一套房产,利用套现资金在休斯顿购入6套房子的新闻引起轩然大波.中国投资人在感叹国内房价太高的同时,纷纷萌生了海外置业抄底买房的念头. [新闻回顾] 去年,土生土长的北京人 ...

vue2.0 技巧汇总

/** * Created by */ export default { trim: (str) => { //删除左右两端的空格 return str.replace(/(^\s*)|(\s* ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.025 s.