继:我朝特有需求之--英文字符占 0.5 个,中文字符占 1 个

什么是ThinkSNS+

ThinkSNS(简称TS)始于2008年,一款全平台综合性社交系统,为国内外大中小企业和创业者提供社会化软件研发及技术解决方案,目前最新版本为ThinkSNS+、ThinkSNS V4、ThinkSNS【简】。

后端框架使用laravel,每周和 laravel master 保持同步,而后台和 html 5 则采用 vue 开发。语言特性方面,采用 php 7 的严格模式。

言归正传,之所以写继篇,其实是来检讨的,上一次发表了《ThinkSNS+?如何计算字符显示长度》后,有网友几经测试后告知str_word_count 有问题。

根据ThinkSNS+ 的进度安排,最近在研发支付功能,所以只能使用周末的时间做了一个兼容性更好的计算方法。

需求

重新说下需求:在我天朝 PM 经常会提一种要求,就是例如一个用户名最多输入12个汉字,但是英文可以输入24个,混排也要满足这个规则。

简言之:单字节字符占0.5,多字节字符占1字节。

解决

闲下来的时候看了上篇文章中的算法,其实是没什么问题的,只是兼容性不够好,而且写那个方法时想得过于复杂

也不知道当时脑袋里面都想啥了

我们看上一篇中计算多字节的方法:

$double = str_word_count(preg_replace(‘([a-zA-Z0-9_])‘, ‘‘, $value));

计算方法是剔除我们需求中允许的单字节,然后通过 str word count 来获取多字节的个数,其实这个函数是可以获取到的,但是部分系统下是不会成功的。还有一个函数就可以直接获取多字节的个数 mb strlen 修改后如下:

$double = mb_strlen(preg_replace(‘([a-zA-Z0-9_])‘, ‘‘, $str));

然后我们就可以正确完成这个需求了,最终实现的 Laravel 验证规则如下:

/ 添加长度规则Validator::extend(‘display_length‘, function ($attribute, $value, array $parameters) {
    if (empty($parameters)) {
        throw new \InvalidArgumentException(‘Parameters must be passed‘);
    }

    $min = 0;
    if (count($parameters) === 1) {
        list($max) = $parameters;
    } elseif (count($parameters) >= 2) {
        list($min, $max) = $parameters;
    }

    if (! isset($max) || $max < $min) {
        throw new \InvalidArgumentException(‘The parameters passed are incorrect‘);
    }

    // 计算单字节.
    preg_match_all(‘/[a-zA-Z0-9_]/‘, $value, $single);
    $single = count($single[0]) / 2;

    // 多子节长度.
    $double = mb_strlen(preg_replace(‘([a-zA-Z0-9_])‘, ‘‘, $value));

    $length = $single + $double;

    return $length >= $min && $length <= $max;
});

Laravel 通过上面的规则,可以在表单验证规则中直接验证,还支持传入最小值和最大值。

上面的代码都是来自于基于 Laravel 开发的开源程序 ThinkSNS+ 中,ThinkSNS+ 采用 apache-2.0 协议开源,我相信可以作为很多 Laravel 学习者的学习程序之一。

项目地址:GitHub: https://github.com/zhiyicx/thinksns-plus(点击star关注研发动态,感谢大家的支持

原文地址:https://blog.51cto.com/14231620/2413415

时间: 2024-11-02 21:25:24

继:我朝特有需求之--英文字符占 0.5 个,中文字符占 1 个的相关文章

ctrl c 中文字符到 vnc 里,中文字符已经被转码

为了测试程序对多语言字符的支持情况,我找来一段中文和北欧的文字,希望把这些文字上传到elasticsearch,并能正确显示. 首先测试了北欧文字,一切OK. 但是中文复制到 VNC 客户端(Linux)后却是问号,因为Linux本来就打不出中文,所以显示乱码我也没在意,我觉得中文的编码无非就是一坨二进制的东西,我又没有改变什么,显示问号只是 linux 无法解析而已.跑了下程序,然后到elasticsearch查询结果,中文部分依然显示的是问号. 接下来就几个想法,首先是,程序在某处应该设置c

字符(字母、数字、中文字符)统计示例

本文给出一个字符统计的例子.给定一串字符,统计其中字母.数字.中文字符.空格以及其它字符的个数. 在编写程序之前,需要考虑一下,怎样判断一个字符是一个中文字符呢? 基本的 CJK 汉字的 Unicode 码范围是 U4E00-U9FBF, 虽然是还有扩展,但是一般使用这个范围去判断一个字符是否为中文字符已经足够了.所以判断一个字符是否为中文的方法如下: public static boolean isChineseCharacter(char c) { return c >= '\u4E00'

设置ubuntu默认中文字符

一. Ubuntu默认的中文字符编码 Ubuntu默认的中文字符编码为zh_CN.UTF-8,这个可以在 /etc/environment中看到:sudo gedit /etc/environment可以看到如下内容:PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games"LANG="zh_CN.UTF-8"LANGUAGE="zh_CN:zh:en_US:

Servlet &amp; JSP - 中文字符问题

Servlet 中的中文字符 来自 URL 参数部分的中文字符 Tomcat 默认接收数据的编码是 ISO-8859-1.所以当请求 URL 的参数部分含有中文字符,需要转换字符的编码. Enumeration<String> paramNames = req.getParameterNames(); while (paramNames.hasMoreElements()) { String paramName = (String) paramNames.nextElement(); Stri

截取中文字符长度(中文、字母都有效)

以下给大家分享下:"中文字符长度,和截取中文字符(字母汉字通用)" 样例:先算出字符的长度,在截取显示,日过字符长度超过6就用...取代 echo '<meta http-equiv="content-type" content="text/html;charset=utf-8"/>'; $CustomizedInfo = '美日汇购物返利网http://www.hnzyxok.com/'; if(mb_strlen($Customi

输入一串只含有中文、英文和数字的字符串,统计其中中文字符、英文字符和数字字符各有多少个?

public class StatisticZEN { public static void main(String[] args) { String str = "中国aadf的111萨bbb菲的zz萨菲"; statisticsChar(str); } private static HashMap<String, Integer> statisticsChar(String str) { int chineseCount = 0; int englishCount =

编译器DIY之———统计英文文本中的单词数,字符数和行数

咳咳,这一章节应该是连载编译器的DIY的,可是在做DIY之前先用flex 来练练手,对于后面的理解有帮助作用. 在word 中我经常看到有一个单词统计的功能,那么是怎么来实现的了,当然第一个念头就是遍历整个文本依据换行和空格对字符串进行分析,那么这是可行的.可是能不能简单点了,其实对文本做单词分析,大家都知道怎么做,难得地方可能就是代码的实现了,那么现在如果使用正则表达式来实现的话,那么一切问题就Over 了. 环境:ubuntu(当然装了flex的windows和mac也可以) 原码: %{

java面试题:如果一串字符如&quot;aaaabbc中国1512&quot;要分别统计英文字符的数量,中文字符的数量,和数字字符的数量,假设字符中没有中文字符、英文字符、数字字符之外的其他特殊字符。

package com.swift; public class TotalNumber_String { public static void main(String[] args) { /* * 如果一串字符如"aaaabbc中国1512"要分别统计英文字符的数量,中文字符的数量,和数字字符的数量, * 假设字符中没有中文字符.英文字符.数字字符之外的其他特殊字符. */ String str="aaaabbc中国1512"; int engishCount =

java算法面试题:有一个字符串,其中包含中文字符、英文字符和数字字符,请统计和打印出各个字符的个数 按值的降序排序,如果值相同则按键值的字母顺序

package com.swift; import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class Zhongwen_Shuzi_Times { public static void main(String[] args) { /* * 有一个字符串,其中包含中文字符.英文字符和数字字符,请统计和打印出各个字符的个数 */ String str="琅琊榜fengqichanglin