php去除html标签并截取中文字符

系统自带的函数mb_substr可以截取多字节的字符

strip_tags — 从字符串中去除 HTML 和 PHP 标记

通过这两个函数便可解决

示例：

$str="我爱php";

echo mb_substr(strip_tags($str),0,3,‘utf-8‘);

输出：我爱p

时间： 2024-08-24 00:49:51

php去除html标签并截取中文字符的相关文章

解决出现乱码substr截取中文字符 siluke123

siluke123< ?php echo mb_substr('这样一来我的字符串就不会有乱码^_^', 0, 7, 'utf-8');?>输出:这样一来我的字< ?phpecho mb_strcut('这样一来我的字符串就不会有乱码^_^', 0, 7, 'utf-8');?>输出:这样 string mb_strcut ( string $str , int $start [, int $length [, string $encoding ］ )mb_strcut() 和 m

截取中文字符长度（中文、字母都有效）

以下给大家分享下:"中文字符长度,和截取中文字符(字母汉字通用)" 样例:先算出字符的长度,在截取显示,日过字符长度超过6就用...取代 echo '<meta http-equiv="content-type" content="text/html;charset=utf-8"/>'; $CustomizedInfo = '美日汇购物返利网http://www.hnzyxok.com/'; if(mb_strlen($Customi

php中截取中文字符会出现乱码的问题

php中内置函数substr()可以对指定字符串进行截取,不过,它只对全英文字符串的截取是比较适合的.如果字符串中出现了中文,就有可能导致截取后出现乱码的问题,甚至在一些场景中如json编码的时候会导致输出结果为null. 原因是不同字符集中每个字符占用的字节数不一样,如UTF-8编码中每个汉字占3字节,而GB2312汉字占2字节,英文则都只占1字节.确切的说substr()中后两个参数指定的是字节数量而不是字符数量,所以就有可能出现最后一个汉字字符截取不完整的情况从而出现中文乱码. 遇到中文字

编码-截取中文-去除HTML字符

处理字符串的一些js/jq方法（去除HTML，去除空格，计算真实长度，截取中英文字符）

stringObject.replace(regexp,replacement) regexp 必需.规定了要替换的模式的 RegExp 对象.请注意,如果该值是一个字符串,则将它作为要检索的直接量文本模式,而不是首先被转换为 RegExp 对象.replacement 必需.一个字符串值.规定了替换文本或生成替换文本的函数. 去除html标签:function del_html_tags(str){ var words = ''; words = str.replace(/<[^>

php 截取文章内容生成纯文本摘要（去除html标签）

废话少说,直接上代码: $str = ' 我是需要保留的文字 alsdkjf;laskjd;flasj; asdjfasjd;lkafsj;lfdkj aksdjfl;ak '; $subject = strip_tags($str);//去除html标签 $pattern =

【转载】C# 字符串截取指定长度的中文字符--精点

通常,一个中文会占两个字节的空间.很多语言里,一个中文字符就算是2个字符长度. 但在C#中,string里包含的中文字符只占一个字符长度.这就导致很多时候,使用string.SubString(int startIndex,int length)方法来截取字符会错位. 最近由于工作原因,会截取指定长度的字符来使用.但是在文档里,1个中文是2个长度来计算.刚开始还只是以为文档错误,后来才知道是由于C#的差异造成的. 刚开始,是直接到网上找算法,但是找到的算法,基本思路都是挨个字符判断(根据ASCI

一些实用函数：去除html标签//去除空白//截取汉字

$subject = strip_tags($newsRs['content']);//去除html标签 $pattern = '/\s/';//去除空白 $content = preg_replace($pattern, '', $subject); $seodata['articledescription'] = mb_substr($content, 0, 80);//截取80个汉字 current() - 返回数组中的当前元素的值,同pos() end() - 将内部指针指向数组中的最后

Fastdb 之中文字符截取错误的问题

Fastdb C#版本中,如果定义字段类型为 CLI.FieldType.cli_asciiz,使用的过程中插入中文字符集会出现乱码的情况, 追查code发现是在对字符串缓冲区CopyBufferData的过程中直接fastdb直接使用了s.length获取了字符个数,而不是获取字节数,由于中文占位两个字节,所以导致数据copy不全,从而出现乱码. 不多说,修正代码如下: protected int bytelengh(string str) { //使用Unicode编码的方式将字符串转换为