php 中文字符串截取乱码

PHP截取字符串如果是英文直接用substr就可以了,但对于中文字符，用substring可能会导致乱码，那么将如何解决呢？

1、通过函数mb_substr实现

说明：mb_substr($str, $start, $length, $encoding);通过该函数即可，但需要加载php_mbstring.dll扩展。

案例：

<?php 
		$str = ‘这是一个字符串切割函数‘; 
		echo "mb_substr:".mb_substr($str, 0, 7, ‘utf-8‘); 
?>

2、通过函数mb_strcut实现

说明：mb_strcut() 和 mb_substr() 类似，都是从一个字符串中提取子字符串，但是按字节数来执行，而不是字符个数。如果截断位置位于多字节字符两个字节的中间，将于该字符的第一个字节开始执行。这也是和 substr() 函数的不同之处，后者简单地将字符串在字节之间截断，这将导致一个畸形的字节序列。

3、通过编写的函数（支持UTF-8和GB2312）

案例：

<?php 
/* 
Utf-8、gb2312都支持的汉字截取函数 
cut_str(字符串, 截取长度, 开始长度, 编码); 
编码默认为 utf-8 
开始长度默认为 0 
*/ 

function cut_str($string, $sublen, $start = 0, $code = ‘UTF-8‘) 
{ 
     $string = str_replace(array(‘&‘, ‘"‘, ‘<‘, ‘>‘), array(‘&‘, ‘"‘, ‘<‘, ‘>‘), $string);
     if($code == ‘UTF-8‘) 
     { 
         $pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/"; 
         preg_match_all($pa, $string, $t_string); 

         if(count($t_string[0]) - $start > $sublen) return join(‘‘, array_slice($t_string[0], $start, $sublen))."..."; 
         return join(‘‘, array_slice($t_string[0], $start, $sublen)); 
      } 
      else 
      { 
         $start = $start*2; 
         $sublen = $sublen*2; 
         $strlen = strlen($string); 
         $tmpstr = ‘‘; 

         for($i=0; $i< $strlen; $i++) 
         { 
            if($i>=$start && $i< ($start+$sublen)) 
            { 
                if(ord(substr($string, $i, 1))>0xa0) 
                { 
                    $tmpstr.= substr($string, $i, 2); 
                } 
                else 
                { 
                    $tmpstr.= substr($string, $i, 1); 
                } 
             } 
             if(ord(substr($string, $i, 1))>0xa0) $i++; 
          } 
          if(strlen($tmpstr)< $strlen ) $tmpstr.= "..."; 
          return $tmpstr; 
        } 
} 

$str = "这是一个字符串切割函数"; 
echo cut_str($str, 8, 0, ‘gb2312‘); 
?>

时间： 2024-10-16 00:53:37

php 中文字符串截取乱码的相关文章

php中文字符串截取方法实例总结

本文实例总结了php中文字符串截取方法,非常实用的技巧.具体方法分析如下: 1.使用mbstring扩展库的mb_substr截取就不会出现乱码了. 2.自己书写截取函数,但效率不如用mbstring扩展库来得高. 3.如果仅是为了输出截取的串,可用如下方式实现:substr($str, 0, 30).chr(0). substr()函数可以分割文字,但要分割的文字如果包括中文字符往往会遇到问题,这时可以用mb_substr()/mb_strcut这个函数,mb_substr()/mb_str

java中文字符串截取

/** * author geksong <br/> * function 中文字符串相关操作<br/> **/ public class ChinaStringUtil { /** * 判断字符是不是中文字符 * @param c * @return */ public static boolean isChinese(char c) { int ascii = (int)c; if(ascii >= 0 && ascii <= 255) return

Thinkphp 模板中直接对数据处理模板中使用函数中文字符串截取

1.Thinkphp 模板中直接对数据处理:{$data.name|substr=0,3} 2.中文字符串截取函数:mb_substr=0,14,'utf-8' 3.中文字符串统计:iconv_strlen(字符串,"UTF-8") <div style="margin-bottom: 8px;"> <a href="#" target="_blank" class="my_a" >

SpringMVC Ajax请求时返回json中文字符串的乱码问题的解决方案

1.org.springframework.http.converter.StringHttpMessageConverter类是处理请求或相应字符串的类,并且默认字符集为ISO-8859-1,所以在当返回json中有中文时会出现乱码. 2.StringHttpMessageConverter的父类里有个List<MediaType> supportedMediaTypes属性,用来存放StringHttpMessageConverter支持需特殊处理的MediaType类型,如果需处理的Me

php实现中文字符串截取无乱码的方法

首页要知道的:1.中文字符在gbk编码下占2个字节,在utf-8编码下占3个字节 2.ord() 函数返回字符串第一个字符的 ASCII 值 3.中文字符的ASCII值是大于0xa0. 关键的点是判断要截取的字符串是中文字符还是英文字符,用ord(substr($str,$start,1))>0xa0可判断,大于则是中文,否则是英文.实现代码如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

php 中文字符串截取方法解析

用PHP函数substr截取中文字符可能会出现乱码,主要是substr可能硬生生的将一个中文字符“锯”成两半.解决办法: 1.使用mbstring扩展库的mb_substr截取就不会出现乱码了. 2.自己书写截取函数,但效率不如用mbstring扩展库来得高. 3.如果仅是为了输出截取的串,可用如下方式实现:substr($str, 0, 30).chr(0). substr()函数可以分割文字,但要分割的文字如果包括中文字符往往会遇到问题,这时可以用mb_substr()/mb_strcut这

SQL Server 插入含有中文字符串出现乱码现象的解决办法

ELECT COLLATIONPROPERTY('Chinese_PRC_Stroke_CI_AI_KS_WS', 'CodePage') --查询SQLServer编码格式的语句下面是查询结果对照: 936 简体中文GBK 950 繁体中文BIG5 437 美国/加拿大英语 932 日文 949 韩文 866 俄文 65001 unicode UFT-8 插入一条带中文字符串的数据, 我们可以通过修改数据库的Collation 来修改数据库的编码方式: 点击确定就可以啦! 我们

php截取中文字符串无乱码的方法

利用php内置方法mb_substr截取中文不乱码,使用起来非常简单 <?php $str = '我喜欢laravel or yii2'; echo mb_substr($str, 0, 1, 'utf8'); //输出我 exit; mb_substr方法比substr多一个参数,用来指定字符串编码.utf-8编码截取示例 $str = '我like laravel or yii2'; echo mb_substr($str, 0, 2, 'utf8'); //输出我I 中英混合也完全没有

php 中文字符串截取

在php中mb_substr()函数是用来截中文与英文的函数,可以方便快速的解决截取指定字符长度的问题,下面我来给大家介绍介绍. 提示:mb_substr在于php中是默认不被支持的我们需要在在windows目录下找到php.ini打开编辑,搜索mbstring.dll,找到;extension=php_mbstring.dll把前面的;号去掉才可以使用mb_substr函数哦. Function: mb_substr( $str, $start, $length, $encoding ) $