一个包含中英文的字符串如何获得它的自然长度

$str = ‘Hello world!‘;
echo strlen($str); // 输出12

然而在PHP自带的函数中，strlen及mb_strlen都是通过计算字符串所占字节数来计算长度的，在不同的编码情况下，中文所占的字节数是不同的。在GBK/GB2312下，中文字符占2个字节，而在UTF-8下，中文字符占3个字节。

$str = ‘你好，世界！‘;
echo strlen($str); // GBK或GB2312下输出12，UTF-8下输出18

而我们在判断字符串长度时往往需要判断的是字符的数量，而非字符串所占字节数，如在UTF-8下的这段PHP代码：

$name = ‘张耕畅‘;
$len = strlen($name);
// 输出 FALSE，因为在UTF-8下三个中文占9个字节
if($len >= 3 && $len <= 8){
 echo ‘TRUE‘;
}else{
 echo ‘FALSE‘;
}

<?php
/**
 * 获取包含中英文的字符串长度
 */
$str = ‘测试abc123‘;
echo strlen($str)."<br>";
echo mb_strlen($str,‘utf-8‘);
?>

输出结果为12和8，PHP自带的函数strlen()是通过计算字符串所占字节数来统计字符串长度的，一个英文字符占1字节，而中文则不然，在gbk编码下每个中文字符所占字节为2，而在utf-8编码下每个中文字符所占字节为3，测试代码用的UTF-8编码，所以输出12，函数mb_strlen(string $str[,string $encoding = mb_internal_encoding()])需要扩展库mb_string.dll才能使用，第一个参数str是要检查长度的字符串，第二个参数encoding为字符编码，如果省略，则使用内部字符编码，函数返回具有encoding编码的字符串str包含的字符数，多字节的字符被计为1，如果给定的encoding无效则返回FALSE，所以输出结果为8。

时间： 2024-10-12 02:05:10

一个包含中英文的字符串如何获得它的自然长度的相关文章

编写一个python程序，从控制台输入一个包含整数的字符串，将字符串中的整数格式化为长度为10的格式，位数不足前面补0，例如：456格式化成0000000456，具体要求如下:1、不使用正则表达式。2、使用字典格式化字符串。3、将从控制台输入的字符串转换为字符串模板再进行格式化。4、最后在控制台输出字符串模板和格式经结果。

s = input("请输入一个包含整数的字符串:") s1 = '' number = '' index = 0 d = {} print(len(s)) for i in range(len(s)): c = s[i] if c.isdigit(): number += c else: if len(number) > 0: # ab34cd54ab45 ab{number0}cd{number1}ab s1 += "{{number{}:010}}".f

一个包含中英文的字符串如何获得它的自然长度

一个包含中英文的字符串如何获得它的自然长度的相关文章

ThinkPHP+Smarty模板中截取包含中英文混合的字符串乱码的解决方案

生成一个包含所有汉字的字符串 "一"字开始"\4e00 到9fa5

c#生成一个某文本中不包含的随机字符串

java按给定字节数截取含有中英文的字符串

ASP如何计算中英文混合字符串长度和截取字符串

vb.net中，如何把byte array还原成为包含中文的字符串

dr-helper项目设计介绍（一个包含移动端和Web端的点餐管理系统）

c#的中英文混合字符串截取