FAQ系列 | utf8表存储latin1乱码字符转换

线上有个数据表，字符集是utf8，但由于环境不统一的原因，导致实际上数据表存储的内容是latin1内码的数据。
也就是说，借着utf8的壳子，实际存储着latin1字符集的数据。
在这种情况下，需要注意几个字符集配置：

客户端终端工具(SecureCRT)的显示字符集设置为：utf-8，
Linux终端(TERM)下，设置LANG环境变量为：en_US.UTF-8，或者zh_CN.UTF-8，
连接到MySQL后，设置client/connect字符集为：latin1 (set names latin1)。

完成上述设置后，在Linux命令行的mysql cli客户端中才能正常显示中文。
为了统一，需要将这些数据的内码也转成utf8才行，可以按以下几个步骤完成：

用latin1字符集将原始数据导出，确保在本地客户端(中文环境)下用文本编辑器可以正常查看，
用文本编辑器另存为utf-8字符集后上传到server端或者把数据直接拷贝到
Linux终端下，新建一个文件，直接将数据粘贴进去，
清空数据表(truncate)，修改字符集(alter table xx default charset = utf8)，
将文本导入到数据表中。

上面是比较笨的手工操作方法，以演示整个过程。
如果表里存储比较复杂的数据时，建议写程序进行转换，毕竟内码不同，无法直接在线转换。

--------------------------------------分割线--------------------------------------

知数堂（http://zhishuedu.com）培训是由资深MySQL专家叶金荣、吴炳锡联合推出的专业优质培训品牌，主要有MySQL DBA实战优化和Python运维开发课程，是业内最有良心、最有品质的培训课程。

时间： 2024-10-07 01:11:50

FAQ系列 | utf8表存储latin1乱码字符转换的相关文章

[MySQL FAQ]系列 — 为什么InnoDB表要建议用自增列做主键

[MySQL FAQ]系列 — 为什么InnoDB表要建议用自增列做主键 http://imysql.com/2014/09/14/mysql-faq-why-innodb-table-using-autoinc-int-as-pk.shtml 我们先了解下InnoDB引擎表的一些关键特征: InnoDB引擎表是基于B+树的索引组织表(IOT): 每个表都需要有一个聚集索引(clustered index): 所有的行记录都存储在B+树的叶子节点(leaf pages of the tree):

Linux字符编码默认为UTF-8，如出现乱码可设置为GBK

Linux字符编码默认为UTF-8,如出现乱码可设置为GBK1.手动更改profile文件的命令: vi /etc/profile 也可以修改 /etc/sysconfig/i18n 文件,如 LANG="en_US.UTF-8" LANG="zh_CN.GB18030" 还有一种方法 cp /etc/sysconfig/i18n $HOME/.i18n 修改 $HOME/.i18n 文件,如 LANG="en_US.UTF-8" LANG=&q

MySQL对JSON类型UTF-8编码导致中文乱码探讨

前言继上文发表之后,结合评论意见并亲自验证最终发现是编码的问题,但是对于字符编码还是有点不解,于是乎,有了本文,我们来学习字符编码,在学习的过程中,我发现对于MySQL中JSON类型的编码导致数据中文出现乱码还有可深挖之处,接下来我们来分析一下,若有错误之处,还请批评指出. 字符编码评论中指出任何不在基本多文本平面的Unicode字符,都无法使用MySQL的utf8字符集存储,包括Emoji 表情(Emoji 是一种特殊的Unicode 编码,常见于IOS和Android 手机上)和很多不常

ajax交互servlet返回数据和jdbc模糊查询-中文-已经设置了UTF-8和解决了乱码

1.编码是将字符按一定翻译方式转换成字节存储在内存或外存中,解码是按照一定翻译方式将存储中的字节转换成字符. 2.ASCII是单字节,最高位总为0,相当于只占用了一个字节的7位,2^7=128个字符,相当于键盘上的128个键,有大小写因为字母,有*,%￥#@!+....等这些可显示字符,也有不可以显示的控制符F1,ctr... 而ISO-8859-1是启用了ASCII码的最高位,理论上是能再多128位,实际上没用掉这么多,至于多了那些,你们自己查下表 UTF-8是可变长的,具体中文几个字节,怎么

字符编码、字符存储、字符转换及工程中字符的使用

字符编码.字符存储.字符转换及工程中字符的使用版本控制版本时间(北京时间) 作者备注 V1.0 2016-05-13 施小丰创建本文.第七章工程总结尚未完成一. 前言 1. 目的本文主要用于整理字符相关知识,包括字符编码.字符存储.行业标准.文件读写.工程注意事项等涉及字符相关的内容, 从而在实际工程中更好地设计和使用字符.更快地解决字符问题. 2. 适用范围本文标题是"Windows C++字符编码.存储.转换大全", 但

【Java基础】Java中的char是否可以存储一个中文字符之理解字符字节以及编码集

Java中的一个char采用的是Unicode编码集,占用两个字节,而一个中文字符也是两个字节,因此Java中的char是可以表示一个中文字符的. 但是在C/C++中由于采用的字符编码集是ASCII,只有一个字节,因此是没办法表示一个中文字符的. 解答了上面的浅显易懂的问题之后,下面彻底理清楚字符字节以及编码的原理. 其实关于编码以及字节的问题,在腾讯实习生一面的时候也问到过,当时搞不懂面试官为什么会问这个问题,现在想想,这个问题还是很考验一个人的思考以及钻研深度的,而且这个问题远远比自己想象

使用UTF8字符集存储中文生僻字

使用UTF8字符集存储中文生僻字一.相关学习BLOG https://www.cnblogs.com/jyzhao/p/8654412.html http://blog.itpub.net/781883/viewspace-1411259/ https://www.qqxiuzi.cn/bianma/zifuji.php https://blog.csdn.net/iteye_7853/article/details/82516888 二.需求详情:客户提出,关于氮卓斯汀变更为氮?斯汀,系统出

彻底弄懂UTF-8、Unicode、宽字符、locale

目录 Unicode.UCS UTF8 结论: 宽字符类型wchar_t locale 为什么需要宽字符类型多字节字符串和宽字符串相互转换最近使用到了wchar_t类型,所以准备详细探究下,没想到水还挺深,网上的资料大多都是复制粘贴,只有个结论,也没个验证过程.本文记录探究的过程及结论,如有不对请指正. Unicode.UCS UCS(Universal Character Set)本质上就是一个字符集. Unicode的开发结合了国际标准化组织所制定的?ISO/IEC 10646,即通用字

新兵训练营系列课程——海量数据存储基础

新兵训练营系列课程--海量数据存储基础 2015年8月12日 09:24 阅读 16831 微博平台研发作为微博的底层数据及业务支撑部门,已经经历了5年的发展历程.伴随着从数据及业务暴发式增长,我们在海量数据存储方面遭遇了诸多挑战,与此同时也伴随着丰富经验的积累. 本次新兵训练营,受众在于应届毕业生,目的在于让新同学系统化并且有针对性的了解平台的核心技术及核心业务,以使新同学在新兵训练营结束后,能够对平台的底层架构与业务有一定的了解. 本文主要面向新同学介绍平台的核心技术之一--海量数据存储

猜你喜欢

[JSOI2007]祖码Zuma

题目描述这是一个流行在Jsoi的游戏,名称为祖玛. 精致细腻的背景,外加神秘的印加音乐衬托,彷佛置身在古老的国度里面,进行一个神秘的游戏--这就是著名的祖玛游戏.祖玛游戏的主角是一只石青蛙,石青蛙会 ...

【bzoj3224】 Tyvj1728—普通平衡树

http://www.lydsy.com/JudgeOnline/problem.php?id=3224 (题目链接) 题意 1. 插入x数:2. 删除x数(若有多个相同的数,因只删除一个):3. 查 ...

一键搞定苹果电脑的这些小毛病！

这些小毛病,你遇到过吗?] 系统无法正常启动... 连接投影仪不能正常显示... 长时间不关机的苹果电脑,开机黑屏... 这些问题都可能是由于苹果系统内存中存储的一些配置文件造成的. [官方说法](好 ...

Android开发屏幕适配方案

Android屏幕适配方案总结日常开发中,难免遇到屏幕适配的方案,网上也有很多方案,在这里本人只是做一个总结,以免日后使用单位的概念 pt(point):磅,一个标准的固定长度单位,大小为1/72 ...

C++ new到底new什么

9: int *obj = new int(6); 00F714CE push 4 //压栈 00F714D0 call operator new (0F711EAh) //调用new函数返回分配的地 ...

Single Number III——LeetCode

Given an array of numbers nums, in which exactly two elements appear only once and all the other ele ...

一百元的智能家居——Asp.Net Mvc Api+讯飞语音+Android+Arduino

大半夜的,先说些废话提提神如今智能家居已经不再停留在概念阶段,高大上的科技公司都已经推出了自己的部分或全套的智能家居解决方案,不过就目前的现状而言,大多还停留在展厅阶段,还没有广泛的推广起来,有人说 ...

jquery 实现鼠标点击div盒子移动功能

// Start 窗口的拖动 var _move=false; //移动标记 var _x,_y; //鼠标离控件左上角的相对位置 $(document).ready(function(){ $(&q ...

HDU 1495 非常可乐 BFS搜索

题意:有个为三个杯子(杯子没有刻度),体积为s,n,m,s=m+n, 刚开始只有体积为s的杯子装满可乐,可以互相倒,问你最少的次数使可乐均分,如果没有结果,输出-1; 分析:直接互相倒就完了,BFS模 ...

Android线程消息通信（二）

创建线程消息队列 Android应用程序的消息队列是使用一个MessageQueue对象来描述的,它可以通过调用Looper类的静态成员函数prepareMainLooper或者prepare来创建, ...

hbase filter 简介

一.基本介绍 1.FilterList代表一个过滤器列表 FilterList.Operator.MUST_PASS_ALL --> 取交集相当一and操作 FilterList.Operat ...

说说常用的服务器操作

想写写自己日常常用的服务器操作,但是想到这个题目还是有点大的.鸟哥两本linux私房菜的书才说完了所有的服务器操作命令,这里一次性列出来也不现实.差不多这里就写写一些比较常用的命令吧. ps au ...

HDU 1425 sort 题解

选择出数列中前k个最大的数. 这里因为数据特殊,所以可以使用hash表的方法: #include <cstdio> #include <algorithm> #include ...

Git团队协作 - 新feature的开发过程

新feature的开发过程建议使用SmartGit,以下是命令行操作 git checkout -b dev (对于没有分支的人)新建dev分支 git pull origin dev拉取最新数据 ...

IOS性能调优系列：使用Time Profiler发现性能瓶颈

硬广:<IOS性能调优系列>第五篇,预计会有二十多篇,持续更新,欢迎关注. 之前四篇都是关注于内存方面,分析了内存泄漏.僵尸对象.内存分配,本篇介绍Time Profiler工具的使用,开 ...

C++ 编译报错

vs编译错误描绘如下: 1>f:\company\newphone\softphoneservice\softphoneservice\EventS.h(13): error C2143: 语法 ...

Weblogic魔法堂：AdminServer.lok被锁导致启动、关闭域失败

一.判断AdminServer.lok被其进程锁死 >weblogic.management.ManagementException: Unable to obtain lock on **** ...

winform 布局、容器

一.布局属性:1.Anchor: 绑定控件到容器边缘位置保持不变注:四周全锁定时控件随界面变化时变大 2.Dock:绑定到容器的边缘注:下控件到边需先将下控件定义到边再将左右控件新建.到边 3 ...

日本传统音乐风格

日本古典乐有一个显著特诊就是:鬼气森森. 第一.基本音阶我国的古典音乐的音阶为:宫商角徵羽,即12356五个音!这种音程并不符合十二平均律(现代音乐把从一个八度到另一个八度的音程均分为12份,每份即 ...

[转]eclipse中的常用快捷键

1.选中你要加注释的区域,用ctrl+shift+C 会加上//注释2.先把你要注释的东西选中,用shit+ctrl+/ 会加上注释3.要修改在eclispe中的命令的快捷键方式我们只需进入windo ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.