千位分隔符的完整攻略

千位分隔符[1]是很常见的需求，但是输入文本千变万化，如何才能准确添加千分符呢？

纯整数情况

纯整数大概是所有情况里最简单的一种，我们只要正确匹配出千分位就好了。

观察上面的数字，我们可以得出千分位的特征是到字符串终止位有 3n 个数字，不包括起始位。于是可以得到这样的函数：

let milliFormat = (num) => {
    return num && num.toString().replace(/(?=(?!^)(\d{3})+$)/g, ‘,‘)
}

但是往往现实没有那么乐观：

小数的情况

遇到小数时，我们的希望只针对整数部分添加千分符，这时问题就变得稍稍有些棘手了。

如果正则引擎支持逆序环视[2]，我们可以这样构造正则表达式：

(?<=^\d+)(?=(\d{3})+\b)

但是多数语言并不支持逆序环视，所以我们要变通一下：

1. 拿到小数的整数部分

也就是起始位到小数点（非数字）之间的部分，可以这样实现：

^\d+

2. 为整数部分添加千分符

这一步可以利用我们之前的实现，整合在一起如下：

let milliFormat = (num) => {
    return num && num.toString()
        .replace(/^\d+/g, (m) => m.replace(/(?=(?!^)(\d{3})+$)/g, ‘,‘))
}

这个函数对整、小数都能正确处理：

但在实际中，我们还可能传入一个整、小数混合的字符串：

整、小数混合字符串

这时我们就不能继续用字符串起终点 ^$ 来判定边界了，如果改成单词边界 \b 会发生什么呢：

哦不！连小数部分也被添上千分符了！怎样才能避开小数部分？

重新审视我们捕获整数部分所用到的正则：

\b\d+

\b 的界定是 (?<!\w)(?=\w)|(?<=\w)(?!\w)[3]，所以小数点也被视为单词边界了！所以我们不应该用单词边界作为界定条件，重新看刚才的字符串 ‘12345678 1234.5678‘，可以发现整数部分的起始点都有一个特征：要么位于字符串起点，要么跟在空白符后。基于这点我们修改捕获整数部分的正则如下：

(^|\s)\d+

咦，多出来一个空白符？别着急，看看我们用来匹配千分位的正则：

(?=(?!^)(\d{3})+$)

判断条件是非起点、到结尾有 3n 个数字的位置，现在为了去掉这多出来的一个空格，我们应将起始条件改成单词边界：

(?=(?!\b)(\d{3})+$)

完整函数如下：

let milliFormat = (input) => {
    return input && input.toString()
        .replace(/(^|\s)\d+/g, (m) => m.replace(/(?=(?!\b)(\d{3})+$)/g, ‘,‘))
}

酷炫！我们已经能自如应付各种数值的混合了！这时耳边幽幽飘来产品经理的声音：如果我传入含有非数字的字符串呢……

复杂字符串

在上一个例子中，我们只判断了起始边界，于是 1234ww 中的数字部分也会被捕获。为了解决这个问题，我们要加上终止界定。来看看整、小数成立的条件：

字符串中仅包含有数字 0-9 或小数点

依据这个我们可以这样做：

(^|\s)\d+(?=\.?\d*($|\s))

这个正则表示匹配目标应以字符串起始位或空白符开始，紧接着是数字，数字的右边只允许继续是数字或者一个小数点、直到字符串结尾或下一个空格处。来看看它的匹配效果：

好样的！我们已经能精确匹配出正确的部分了！继续用之前的千分位模式封装：

let milliFormat = (() => {
    const DIGIT_PATTERN = /(^|\s)\d+(?=\.?\d*($|\s))/g
    const MILLI_PATTERN = /(?=(?!\b)(\d{3})+$)/g

    return (input) => input && input.toString()
        .replace(DIGIT_PATTERN, (m) => m.replace(MILLI_PATTERN, ‘,‘))
})()

酷炫！全部都正确处理了！

复杂的现实世界

但是！这还远远不够！我们看这样一个字符串：

‘1234 1234.56 $1234 $-1234 $-1234.56e+7 123...e3‘

容我先去买一根上吊绳……

原文地址：https://www.cnblogs.com/alantao/p/9374021.html

时间： 2024-11-05 22:03:12

千位分隔符的完整攻略的相关文章

js实现千位分隔符

//正则表达式实现千位分隔符 function format(num){ var reg = /\d{1,3}(?=(\d{3})+$)/g; return (num + '').replace(reg, '$&,'); } console.log(format(13123903243)); //13,123,903,243 解释: 正则表达式 \d{1,3}(?=(\d{3})+$) 表示前面有1~3个数字,后面的至少由一组3个数字结尾. ?=表示正向引用,可以作为匹配的条件,但匹配到的内容

android开发新浪微博客户端完整攻略 [新手必读]

开始接触学习android已经有3个礼拜了,一直都是对着android的sdk文档写Tutorials从Hello World到Notepad Tutorial算是初步入门了吧,刚好最近对微博感兴趣就打算开发个android版本的新浪微博客户端作为练手项目,并且以随笔的方式详细的记录开发的全过程.本人对java语言以及eclipse Ide都是初次应用基本上属于边学边用,做移动设备上的东西也是第一次,总的来说属于无基础.无经验.无天赋的纯三无人员,还请广大同学们多多给予指点. 开发第一件事情,那

Javascript 利用正则表达式实现数字千位分隔符

最近在网上有看到使用js来实现数字的千位分隔符的面试(笔试)题,所以就自己写了一个利用“正则+replace”来实现的方法: 1 var thousandBitSeparator = function(numStr){ 2 var b = /([-+]?\d{3})(?=\d)/g; 3 4 return numStr.replace(b, function($0, $1){ 5 return $1 + ','; 6 }); 7 } 支持正负号匹配,小数点区分,如有错误,希望大大们指出:-

使用千位分隔符(逗号)表示web网页中的大数字

做手机端页面我们常常遇到数字,而在Safari浏览器下这些数字会默认显示电话号码,于是我们就用到了补坑的方法加入<meta>标签: <meta name="format-detection" content="telephone=no">这个标签的意义在于将数字不被看成电话号码,于是就万事大吉了O(∩_∩)O,但是如果是一个订餐电话,那么在加入这个标签之后,订餐电话就变成了数字,就不能直接拨号了于是乎我们想到了用千位符老表示数字从而区分电话号

添加千位分隔符

给1234567890,这十个数字增加千位分隔符: Shell下的利器很多,一般最简单的两个方法,一个是Shell自带的printf命令,另一个是Perl的正则.一想到要格式化字符串,其实第一个就应该想到printf,几乎所有的编程语言都会自带这个函数,类Unix下同样到处都兼容神器. 一.Shell的printf如下: printf "%'d\n" 1234567890 二.Perl的正则如下: echo '1234567890' | perl -pe 's/(?<=\d)(?

为数字增加千位分隔符

将普通数字加上千位分隔符在涉及金钱的业务上很常见例如 123456.78 需要显示为123,456.78 使用正则的方法最简单 ``` function numFormat(num){ let res=num.toString().replace(/\d+/, function(n){ // 先提取整数部分 return n.replace(/(\d)(?=(\d{3})+$)/g,function($1){ return $1+","; }); }) return res; } v

pandas dataframe 如何把带有千位分隔符的字符串转化为浮点数

如何将下图中的浏览量(PV).访客数(UV).IP数这几列中的带有千位分隔符","的字符串类型转换成浮点数类型示例代码如下: import pandas as pd test = pd.DataFrame({'A': ['1,232.1', '22,332.3', '3,232', '1,111,111']}) print(type(test.loc[0,'A'])) test1 = pd.DataFrame({}).append(test) test1['A'] = test1

玩转千位分隔符输出

1.Python 1.1 format方法: 2.7版本以上直接用format设置千分位分隔符 Python 2.7 (r27:82500, Nov 23 2010, 18:07:12) [GCC 4.1.2 20070115 (prerelease) (SUSE Linux)] on linux2 Type "help", "copyright", "credits" or "license" for more inform