中文utf8截字

1.网上找的一段代码:


<?php
header(‘content-Type:text/html:charset=utf-8‘);
function substr_chinese($str, $start, $length = null) {
return join("",
array_slice(
preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $start, $length)
);
}
//实例
$str = "中国地图全图";
echo substr_chinese($str, 0, 4);
//输出: 中国地图
?>

结果为空
最后发现 我的文件是latin1
修改成utf8就好了

时间: 2024-10-07 11:30:22

中文utf8截字的相关文章

python中文utf8编码后是占3个字符,unicode汉字为2字节

一个中文utf8编码后是占3个字符,所以求长度的函数可以这样写 def str_len(str): try: row_l=len(str) utf8_l=len(str.encode('utf-8')) return (utf8_l-row_l)/2+row_l except: return None return None unicode中汉字为两字节, utf-8中汉字为三字节 https://en.wikipedia.org/wiki/Unicode https://en.wikipedi

SAE用flask+MySQL中文&#39;utf8&#39; codec can&#39;t decode byte 0xb7解决方法

在Sina App Engine(SAE)上用python flask框架+MySQL搭app服务器时,select返回中文时jsonify函数报如下错误:(为调试放拜我异常时return的traceback.format_exc()) Traceback (most recent call last): File "/data1/www/htdocs/245/jcguo/1/myapp.py", line 88, in searchHotel return jsonify(resul

Latex中文utf-8编码的三种方式

我们知道Latex一般用CJK和CTEX宏包支持中文编辑,CJK和CTEX的默认编码是GBK,而windows下的默然编码就是GBK,因此CJK和CTEX不需要特殊配置就可以直接支持中文Latex编译,只需要用GBK编码保存文件即可.但是如果把文件的字符编码换成现在更加普遍的utf-8的话,应该怎么操作呢?在这里有3种方式可以使用. 1.CJKutf8 CJK有两个基本宏包:CJK和CJKutf8,其中后者面向utf-8编码,其一般使用方法如下: \usepackage{CJKutf8} \be

css文本截字,超出文本省略号显示

一.单行文本截字 p { text-overflow: ellipsis;/*显示省略号代替裁剪的文本*/ white-space: nowrap;/*空白处理方式 不换行*/ overflow: hidden;/*溢出隐藏*/ } 效果: 二.多行文本截字 p{ display:-webkit-box;/*设置盒子为弹性盒容器*/ -webkit-box-orient:vertical;/*设置盒子内部排列方式为垂直排列*/ -webkit-line-clamp:2;/*显示两行*/ text

如何在windows的DOS窗口中正常显示中文(UTF-8字符)

打开CMD.exe命令行窗口,通过 chcp命令改变代码页 UTF-8的代码页为65001,ANSI/OEM - 简体中文 GBK为936,window default OEM - 美国为437 如果chcp命令得到437,那么一定不能显示中文,此时的中文为???.如果是乱码,那么一定字符码不是UTF-8 refer to http://zfj-rails.iteye.com/blog/778022 * 437 — The original IBM PC code page     * 932

primefaces p:dataExporter filename 支持中文 utf8

p:fileDownload and p:dataExporter : for p:fileDownload, the Content-Disposition header should be set like this: externalContext.setResponseHeader("Content-Disposition", contentDispositionValue + ";filename=\"" + content.getName()

97.5%准确率的深度学习中文分词(字嵌入+Bi-LSTM+CRF)

http://www.17bigdata.com/97-5%E5%87%86%E7%A1%AE%E7%8E%87%E7%9A%84%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D%EF%BC%88%E5%AD%97%E5%B5%8C%E5%85%A5bi-lstmcrf%EF%BC%89.html 摘要 深度学习当前在NLP领域发展也相当快,翻译,问答,摘要等基本都被深度学习占领了. 本文给出基于深度

正则验证姓名否中文(包含生僻字)

1.常见的中文 \u4e00-\u9fbb 和 \u4e00-\u9fa5 (不包含生僻字) 2.比较广泛的中文汉字.(包含了咱们需要的生僻字 和 不需要的很多字符 比如 中文句号分号逗号.书名号 等等) \u2E80-\uFE4F 3.CJK标点符号 范围:\u3000-\u303F 参考地址:http://www.unicode.org/charts/PDF/U3000.pdf 根据以上三点,我们要用第二个再排除第三个,所以判断是否包含生僻字的中文姓名的正则表达式如下所示: /^((?![\

中文字体【字蛛】的使用

官网:http://font-spider.org/ 安装字蛛需要先安装node. 先安装好 NodeJS,然后执行: npm install font-spider -g 构建插件:grunt-font-spider | gulp-font-spider 在 CSS 中使用 WebFont: /*声明 WebFont*/ @font-face { font-family: 'pinghei'; src: url('../font/pinghei.eot'); src: url('../font