UTF-8编码下'\u7528\u6237'转换为中文汉字'用户'

UTF-8编码下‘\u7528\u6237‘转换为中文‘用户‘

一、前言

有过多次,在开发项目中遇见设置文件编码格式为UTF-8,但是打开该文件出现类似\u7528这样的数据,看也看不懂,也不是平常见到的乱码。这里的\u7528类似的数据,其中‘\u‘表示UNICODE编码,其实数据就是对应的UTF-8下的汉字。

二、问题处理

下面文件的编码已被设置为UTF-8,但打开这里的原文件部分内容如下:

#use 1,2
#admin_login
100001=\u7528\u6237\u540D\u6216\u8005\u5BC6\u7801\u9519\u8BEF
100002=\u7528\u6237\u540D\u6216\u8005\u5BC6\u7801\u9519\u8BEF
100003=\u7528\u6237\u6B63\u5904\u4E8E\u767B\u9646\u72B6\u6001
100004=\u672A\u77E5\u539F\u56E0,\u767B\u9646\u5931\u8D25
100088=\u767B\u9646\u6210\u529F
#use 3,4
#user_login
300001=\u7528\u6237\u540D\u6216\u8005\u5BC6\u7801\u9519\u8BEF
300002=\u7528\u6237\u540D\u6216\u8005\u5BC6\u7801\u9519\u8BEF
300003=\u7528\u6237\u5904\u4E8E\u767B\u9646\u72B6\u6001
300004=\u672A\u77E5\u539F\u56E0,\u767B\u9646\u5931\u8D25
300099=\u9000\u51FA\u6210\u529F
300088=\u767B\u9646\u6210\u529F
...

文件截图如图2-1所示

图2-1、 ‘\u7528‘数据的文件图

这里使用开发工具是IDEA,其他工具参考设置进行修改。打开IDEA的设置,找到设置编码的页面。菜单路径是File - Settings - Editor - File Encodings。

  • (1)设置全局编码、工程编码、文件默认编码为UTF-8.
  • (2)勾选native-to-ascii
  • (3)点击按钮Apply、OK应用即可

图2-2、IDEA编码设置图

设置完成后配置文件UNICODE编码转换为UTF-8,\u7528转换为对应的汉字。设置完成后效果如图2-3所示。注意如果只设置UTF-8不勾选ascii转换,则文件仍显示为\u7582格式。不能正常显示为中文。

图2-3、UTF-8编码下文件正确显示汉字图

UTF-8编码下'\u7528\u6237'转换为中文汉字'用户'

原文地址:https://www.cnblogs.com/niaonao/p/9276698.html

时间: 2024-11-10 13:50:07

UTF-8编码下'\u7528\u6237'转换为中文汉字'用户'的相关文章

JavaScript为unicode编码转换为中文

代码laycode - v1.1 关于这样的数据转换为中文问题,常用的以下方法. 1. eval解析或new Function("'+ str +'")()  str = eval("'" + str + "'"); // "我是unicode编码" 1 代码laycode - v1.1 2. unescape 解析  str = unescape(str.replace(/\u/g, "%u")); //

JavaScript为unicode编码转换为中文(转)

var str = "\\u6211\\u662Funicode\\u7F16\\u7801"; 关于这样的数据转换为中文问题,常用的以下方法. 1. eval解析或new Function("'+ str +'")() str = eval("'" + str + "'"); // "我是unicode编码" 2. unescape 解析 str = unescape(str.replace(/\u/g,

英文字母和中文汉字在不同字符集编码下的字节数

英文字母和中文汉字在不同字符集编码下的字节数 英文字母: 字节数 : 1;编码:GB2312 字节数 : 1;编码:GBK 字节数 : 1;编码:GB18030 字节数 : 1;编码:ISO-8859-1 字节数 : 1;编码:UTF-8 字节数 : 4;编码:UTF-16 字节数 : 2;编码:UTF-16BE 字节数 : 2;编码:UTF-16LE 中文汉字: 字节数 : 2;编码:GB2312 字节数 : 2;编码:GBK 字节数 : 2;编码:GB18030 字节数 : 1;编码:ISO

中文转换成Unicode编码 和 Unicode编码转换为中文

前几天,遇到一个问题,就是在浏览器地址栏传递中文时,出现乱码,考虑了一下,解决方式有很多,我还是采用了转换编码的方式,将中文转换为Unicode编码,然后再解码成中文,以下是实现的过程,非常简单! package cy.code; public class CyEncoder { private String zhStr; //中文字符串 private String unicode;//将中文字符串转换为Unicode编码 存储在这个属性上. public CyEncoder(String z

jQuery ajax在GBK编码下表单提交终极解决方案(非二次编码方法)(转)

版权声明]:版权归作者所有,转载时请以超链接形式标明文章原始出处和作者信息及本声明:http://www.open-lib.com/Forum/Read_69_1.action 前言: 当jquery ajax在utf-8编码下(页面utf-8,接收utf-8),无任何问题.可以正常post.get,处理页面直接获取正确的内容. 但在以下情况下: GBK -> AJAX POST ->GBK UTF-8 -> AJAX POST ->GBK 后台代码无法获取正确的内容,通常表现为获

MacTex下应用XeLatex实现中文支持

1.tex.latex.xetex.xelatex的关系 Tex是由计算机科学家 D.E.Knuth 设计并实现的排版系统.而LaTeX 就是一个“TeX 宏包”,它扩展了 TeX 的功能,使我们很方便的逻辑的进行创作而不是专心于字体,缩进这些烦人的东西.也就是说,每一个LaTeX 命令实际上最后都会被转换解释成几个甚至上百个TeX 命令.TeX 还有其它的大型宏包,它们和 LaTeX 一起都被叫做 "format(格式)",现在还有一种常用的format叫做 ConTeXt, 用它能

ASCII,Utf8,Unicode编码下的中英文字符大小

一,测试Demo namespace 不同编码下的中英文字符大小 { class Program { static void Main(string[] args) { ShowCode(); } private static void ShowCode() { string[] strArray = { "b","abc","乙","甲乙丙丁"}; byte[] buffer; string mode, back; fore

Xshell下VI打开文件中文乱码解决

修改 /etc/sysconfig/i18n 成如下值:LANG="zh_CN.utf8"LANGUAGE="zh_CN.utf8"SUPPORTED="zh_CN.utf8:zh_CN.GB18030:zh_CN:zh:en_US.UTF8:en_US:en"SYSFONT="lat0-sun16" 保存退出后,重新连接,连接编码也选utf-8即可 Xshell下VI打开文件中文乱码解决,布布扣,bubuko.com

[C语言]Unicode编码(二)-中文字符刷选

Unicode编码(二)-中文字符刷选 1,UTF-8编码中三字节中文字符的刷选方法如下: int chinese_filter(unsigned char one, unsigned char two ) {     int flag = -1;     if ( one >= 0x4E && one < 0x9F )     {         flag = 1;     }     else if ( one == 0x9F && two <= 0x