【技术宅1】实现中文字串截取无乱码的方法

function substr_text($str, $start=0, $length, $charset="utf-8", $suffix=""){

if(function_exists("mb_substr")){//mb_substr函数不是php内置函数，需要加载php.mbstring.dll才能使用，否则报错

return mb_substr($str, $start, $length, $charset).$suffix;

}elseif(function_exists(‘iconv_substr‘)){

return iconv_substr($str,$start,$length,$charset).$suffix;

}else{

$re[‘utf-8‘] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";

$re[‘gb2312‘] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/";

$re[‘gbk‘] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/";

$re[‘big5‘] = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/";

preg_match_all($re[$charset], $str, $match);

$slice = join("",array_slice($match[0], $start, $length));

return $slice.$suffix;

}

print_r(substr_text(‘字符串截取‘, 1, 3))

时间： 2024-12-28 23:47:34

【技术宅1】实现中文字串截取无乱码的方法的相关文章

PHP中实现中文字串截取无乱码的方法

在PHP中,substr()函数截取带有中文字符串的话,可能会出现乱码,这是因为中西文一个字节所占有的字节数不一样,而substr的长度参数是按照字节去算的,在GB2312编码时,一个中文占2个字节,英文为1个字节,而在UTF-8编码当中,一个中文可能占有2个或3个字节,英文或半角标点占1字节. 直接使用PHP函数substr截取中文字符可能会出现乱码,主要是substr可能硬生生的将一个中文字符“锯”成两半.解决办法: 1.使用mbstring扩展库的mb_substr截取就不会出现乱码了.

PHP实现中文字串截取无乱码的方法

直接使用PHP函数substr截取中文字符可能会出现乱码,主要是substr可能硬生生的将一个中文字符“锯”成两半.解决办法: 1.使用mbstring扩展库的mb_substr截取就不会出现乱码了. 2.自己书写截取函数,但效率不如用mbstring扩展库来得高. 3.如果仅是为了输出截取的串,可用如下方式实现:substr($str, 0, 30).chr(0). ============================= substr()函数可以分割文字,但要分割的文字如果包括中文字符往往

php实现中文字符串截取无乱码的方法

首页要知道的:1.中文字符在gbk编码下占2个字节,在utf-8编码下占3个字节 2.ord() 函数返回字符串第一个字符的 ASCII 值 3.中文字符的ASCII值是大于0xa0. 关键的点是判断要截取的字符串是中文字符还是英文字符,用ord(substr($str,$start,1))>0xa0可判断,大于则是中文,否则是英文.实现代码如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

PHP实现中文截取无乱码

字符串的处理是编程中比较常见的,各种编程语言对字符串的处理也提供了大量函数,像php中mb_substr()函数可以实现对中文字符串的截取,如何使用自定义方法实现中文字符串截取无乱码这也是面试经常遇到的一道题目,不要觉得这是多此一举,php内置函数已经实现了,为什么要自己实现.其实这道题的真实目的是考查你对字符编码的理解.最起码你要知道从哪里开始截取,截取几个字节才是一个完整的字符,不然截取到的都是乱码.这就需要你对多字节字符编码有一定的了解.下面一起来实现吧. 1 <?php 2 /** 3

中文截取无乱码

/* *中文截取无乱码 */ function showsubstr_chinese($str, $start, $length = null) { return join("", array_slice( preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $start, $length)); }

php中文截取无乱码

<?php header('Content-Type:text/html;charset=utf-8'); function cutstr($str,$len){ if($len<0){return null;} $chars = 0; //字符数量 $offset = 0; $res = ''; while($chars < $len){ $high = decbin(ord(substr($str,$offset

php截取中文字符串无乱码的方法

利用php内置方法mb_substr截取中文不乱码,使用起来非常简单 <?php $str = '我喜欢laravel or yii2'; echo mb_substr($str, 0, 1, 'utf8'); //输出我 exit; mb_substr方法比substr多一个参数,用来指定字符串编码.utf-8编码截取示例 $str = '我like laravel or yii2'; echo mb_substr($str, 0, 2, 'utf8'); //输出我I 中英混合也完全没有

url中向后台传递中文乱码解决方法

1.jsp中代码 var userNo = $('#prisoner_id').val(); userNo = encodeURI(userNo); allPrisonerGrid.datagrid('options').url = 'mobilemanage!allPrisonerPage.action?test=' + userNo; allPrisonerGrid.datagrid('reload'); 2.action中代码 String userNo =

sublime text3 中 python3编译出现中文乱码解决方法

参考博文:https://blog.csdn.net/Bin_bin_bingo/article/details/80531582 一.乱码现象利用sublime自带编译快捷方式ctrl+B会出现中文乱码的情况 print("没有循环数据!") print("完成循环!") 二.解决方法在Python3.sublime.build中写入下面代码,之后再用ctrl+B进行编译,返回“utf-8”,并且能成功打印中文 { "cmd": [&quo