PHP解码unicode编码中文字符代码

 1 function replace_unicode_escape_sequence($match) {
 2 return mb_convert_encoding(pack(‘H*‘, $match[1]), ‘UTF-8‘, ‘UCS-2BE‘);
 3 }
 4 $name = ‘\u65b0\u6d6a\u5fae\u535a‘;
 5 $str = preg_replace_callback(‘/\\\\u([0-9a-f]{4})/i‘, ‘replace_unicode_escape_sequence‘, $name);
 6 echo $str; //输出： 新浪微博
 7 // www.jbxue.com 脚本学堂
 8 //咱将上述方案A给封装起来~~~(方案A稳定版+升级+推荐)
 9 class Helper_Tool
10 {
11 static function unicodeDecode($data)
12 {
13 function replace_unicode_escape_sequence($match) {
14 return mb_convert_encoding(pack(‘H*‘, $match[1]), ‘UTF-8‘, ‘UCS-2BE‘);
15 }
16
17 $rs = preg_replace_callback(‘/\\\\u([0-9a-f]{4})/i‘, ‘replace_unicode_escape_sequence‘, $data);
18
19 return $rs;
20 }
21 }
22 //调用
23 $name = ‘\u65b0\u6d6a\u5fae\u535a‘;
24 $data = Helper_Tool::unicodeDecode($name); //输出新浪微博

时间： 2024-10-06 23:43:18

PHP解码unicode编码中文字符代码的相关文章

PHP解码unicode编码中文字符代码示例

在抓取某网站数据,结果在数据包中发现了一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a......", 这其实是中文被unicode编码后了的数据,想解码出中文来.解决方案:方案A(稳定版+推荐): function replace_unicode_escape_sequence($match) { return mb_convert_encoding(pack('H*', $match[1]), 'UTF-8', 'UCS-2BE'); } $name

PHP解码unicode编码的中文字符

问题背景:晚上在抓取某网站数据,结果在数据包中发现了这么一串编码的数据:"......\u65b0\u6d6a\u5fae\u535a......www.jinyuanbao.cn", 这其实是中文被unicode编码后了的数据,我现在就是想解码出中文来,疯狂的google之后,发现很多人贴出了如下的函数,不过我发现根本不好使....如何解码unicode编码的字符?[好使] - PHP网站开发 - [开源与分享]每日最新博客在置顶博客之后: 如何解码unicode编码的字符?[好使]

javascript和html中unicode编码和字符转义的详解

原文:http://ulhoo.com/blog/?p=285 1.html中的转义:在html中如果遇到转义字符(如" "),不管你的页面字符编码是utf-8亦或者是GB2312,都会直接打印成相应的字符:而当遇到(如:"\u8981"[此处的8981是16进制值])时,则不会打印成相应字符. /* *html标记的转义 *@example *<p>Hello World!</p> * ||等价于 *<p>Hello World

winform学习日志（二十七）----------unicode编码、字符的转换和得到汉字的区位码

position:static(静态定位) 当position属性定义为static时,可以将元素定义为静态位置,所谓静态位置就是各个元素在HTML文档流中应有的位置 podisition定位问题.所以当没有定义position属性时,并不说明该元素没有自己的位置,它会遵循默认显示为静态位置,在静态定位状态下无法通过坐标值(top,left,right,bottom)来改变它的位置. position:absolute(绝对定位) 当position属性定义为absolute时,元素会脱离文档流

JAVA中文字符编码问题

JAVA的中文字符乱码问题一直很让人头疼.特别是在WEB应用中.网上的分析文章和解决方案都很多,但总是针对某些特定情况的.很多次遇到乱码问题后, 经过极为辛苦的调试和搜索资料后终于解决,满以为自己已经掌握了对付这些字符乱码怪兽的诀窍.可当过段时间,换了个应用或换了个环境,又会碰到那讨厌的火星文,并再次无所适从.于是下决心好好整理一下中文字符编码问题,以方便自己记忆,也为其他程序员兄弟们提供一份参考. 首先要了解JAVA处理字符的原理.JAVA使用UNICODE来存储字符数据,处理字符时通常有

ASCII、GBK、Unicode和UTF-8字符编码的区别联系

很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物.他们看到8个开关状态是好的,于是他们把这称为”字节“.再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状态,状态开始变来变去.他们看到这样是好的,于是它们就这机器称为”计算机“. 开始计算机只在美国用.八位的字节一共可以组合出256(2的8次方)种不同的状态. 他们把其中的编号从0开始的32种状态分别规定了特殊的用途,一但终端.打印机遇上约定好的这些字节被传过来时,就要做

app开发历程————服务器端生成JSON格式数据，采用Unicode编码，隐藏中文

今天,问以前的同事,他们写接口按什么编码,怎么看到有\u的一些看不懂的内容,一问,原来是信息隐藏,防止信息泄漏. 然后在网上查了Java如何把中文转换成unicode编码,转自:http://blog.csdn.net/sunmenggmail/article/details/27539023 1 package mobi.chenwei.wing.util; 2 3 public class CharacterSetToolkit { 4 5 /** 6 * @param args 7 */

js中将整数转成字符，，将unicode 编码后的字符还原出来的方法。

一.将整数转成字符: String.fromCharCode(17496>>8,17496&0xFF,19504>>8,19504&0xFF,12848>>8,12848&0xFF,13360>>8,13360&0xFF,17969>>8,17969&0xFF,12592>>8,12592&0xFF,12337>>8,12337&0xFF,14592>>8

使用UTF8-CPP转换unicode编码附录：UTF8和UTF16和UTF32和Unicode编码

本文用于解决如何用C++处理字符串的编码格式.本文采用的是成熟便捷的UTF8库来处理这个问题.首先是下载UTF8库,网址为:http://utfcpp.sourceforge.net/ 为了方便后续使用这个C++库,我们可以直接将源程序文件utf8.h和文件夹utf8复制到目录/usr/local/include 下,这样就可以在项目中直接调用了. 执行命令: mv * /usr/local/include 1. 最简实例: #include <iostream> #include <