字符串split操作到底有多少坑

微信公众号


长字符串切分,取其中元素封装或者将封装信息组合成长字符串都是常规操作,但是这种长字符串往往是不可控的,如一个长字符串就是由一个元素组成,或者存在空字符串的元素,看似这并没有什么问题,但是使用不同工具类的split方法进行切分结果是完全不同的。不知道你是否遇到这样的坑,下面一起来看看。

String类自带的split方法

直接使用String本身自带的split方法,看对不同字符串的切分结果。

  • 没有分隔符的字符串

    //str = "1"
    public static void split2(String str) {
      String[] splits = str.split(",");
      for (String split : splits) {
          System.out.println("->" + split);
      }
      System.out.println("数组长度:" + splits.length);
    }

    切分后结果是单个元素["1"],数组长度是1。

  • 有分隔符,分隔符切分后没有空字符串出现
    //str = "1,2"
    //代码同上……

    切分后结果是["1","2"],数组长度是2。(假设分隔符是n个,分割后的元素个数是n+1个)

  • 有分隔符,分隔符切分后有空字符串出现
    //str = "1,,2"
    //代码同上……

    切分后结果是["1","","2"],数组长度是3。(假设分隔符是n个,分割后的元素个数是n+1个)

最终总结不管分隔符有多少个,最终切分的结果都是n+1个元素。也是正常业务逻辑所需要的。但是这里有一个问题,如果传入的字符串是null的时候会报NullPointException异常,需要另外加一层非空判断。

commons提供的StringUtils工具类

具体全限定类名是org.apache.commons.lang3.StringUtils,这个可以说是最常用一个字符串的工具类。如判断非null、非空字符串或者非空格,用isNotBlank方法,使用集合元素组装字符串,用join方法等等。现在来看一下split方法在不同的情况下是如何实现。

  • 没有分隔符的字符串

    //str = "1"
    public static void split1(String str) {
      String[] splits = org.apache.commons.lang3.StringUtils.split(str, ",");
      for (String split : splits) {
          System.out.println("->" + split);
      }
      System.out.println("数组长度:" + splits.length);
    }

    切分后的结果是单个元素["1"],数组长度为1。

  • 有分隔符,分隔符切分后没有空字符串出现
    //str = "1,2"
    //代码同上……

    切分后的结果是两个元素["1","2"],数组长度为2。

  • 有分隔符,分隔符切分后有空字符串出现
    //str = "1,,2"
    //代码同上……

    切分后的结果和上一种情况结果是一样的,也是两个元素["1","2"],数组长度为2。

从这里就可以看的出来问题的所在,当出现空字符串的时候,会自动将空字符串丢弃,只保留非空字符串。但是这里还是需要注意的是如果是空格,也会形成一个元素。比如现在str输入的是"1, ,2",两个分隔符间有一个空格,此时就会切分成三个元素。

Spring下util包提供的StringUtils工具类

全限定类名org.springframework.util.StringUtils,这个StringUtils也经常被用到,因为在输入StringUtils的时候,IDEA自动提示,往往它就是在第一位。那它和上面两种在split方法上有什么不同呢?

  • 没有分隔符的字符串

    //str = "1"
    public static void split3(String str) {
      String[] splits = org.springframework.util.StringUtils.split(str, ",");
      for (String split : splits) {
          System.out.println("->" + split);
      }
      System.out.println("数组长度:" + splits.length);
    }

    这个时候对不起,会报NullPointerException异常,也就是这个split方法必须要有分隔符的存在。

  • 有分隔符,分隔符切分后没有空字符串出现
    //str = "1,2"
    //代码同上……

    切分后的结果是两个元素["1","2"],数组长度为2。

  • 有分隔符,分隔符切分后有空字符串出现
    //str = "1,,2"
    //代码同上……

    切分后的结果是两个元素["1",",2"],数组长度为2。看到这里可能你会认为我这个数组格式写错了,但是实际上第二个元素的确是这样的,确定无疑。

这个split方法还是很坑的,它会从字符串中找分隔符是否存在,如果不存在直接报错,如果存在,不管有多少个分隔符,都是以第一个分隔符做切分,最终形成两个元素。

总结

三个split方法三种不同的切分逻辑,到底在什么时候用那种方式切分就很讲究了,因为在开发过程中因为这个切分出过很多莫名其妙的BUG。我就遇到过两次。

  • 第一次是使用的org.apache.commons.lang3.StringUtils来切分字符串,字符串内有空字符串存在,导致切割后的元素个数和实际个数不同,准确的来说少了元素,结果代码中在向另一个字符串占位符中填充数据的时候,总是出现错位的现象。(如本来应该放在占位符3位置上的字符串出现为空字符串,在切分的时候,3位置的元素实际被抛弃,4位置的元素放在了3的位置)
  • 第二次也是使用的org.apache.commons.lang3.StringUtils来切分字符串,测试一直都是很正常,但是测试一段时间后,发现报NullPointException,排查后才发现,引入的StringUtils被其他开发人员换成了org.springframework.util.StringUtils导致的。因为这个字符串可能没有分隔符。

原文地址:https://blog.51cto.com/14493180/2428410

时间: 2024-10-10 07:59:52

字符串split操作到底有多少坑的相关文章

Java 字符串Split方法的一个坑

java字符串的split,只传一个参数,后面空白的字符串会被忽略: public static void main(String[] args) { String str = "ab|c||"; String [] split = str.split("\\|"); System.out.println(Arrays.toString(split)); } 输出结果是[ab, c]. 解决方法是split第二个参数传一个负数,例如 public static vo

python字符串的操作(去掉空格strip(),切片,查找,连接join(),分割split(),转换首字母大写, 转换字母大小写...)

#可变变量:list, 字典#不可变变量:元祖,字符串字符串的操作(去掉空格, 切片, 查找, 连接, 分割, 转换首字母大写, 转换字母大小写, 判断是否是数字字母, 成员运算符(in / not in))字符串使用时用单引号或者双引号括起来: var1 = 'hello' var2 ="world" 字符串不能修改值, 如下例所示: 以下是字符串常用的一些操作. 1. 去掉空格str.strip() # 去掉两边的空格和换行符str.strip('a') # 去掉两边指定的字符st

Python学习-字符串函数操作3

字符串函数操作 isprintable():判断一个字符串中所有字符是否都是可打印字符的. 与isspace()函数很相似 如果字符串中的所有字符都是可打印的字符或字符串为空返回 True,否则返回 False str1 = 'gheruiv'; str2 = '\n\t'; print(str1.isprintable()); //True print(str2.isprintable()); //False istitle():判断一个字符串中所有单词的首字母是不是大写 返回值为布尔类型,T

字符串的操作及其部分格式化

#字符串的操作及其部分格式化 i=3 str="FGdV" while i>0: i=i-1 user_input=input("please enter security code:") if str.upper()==user_input.upper(): print("Input success") break else: print("please enter again:") print("You h

Python学习笔记五:字符串常用操作,字典,三级菜单实例

字符串常用操作 7月19日,7月20日 ,7月22日,7月29日,8月29日,2月29日 首字母大写:a_str.capitalize() 统计字符串个数:a_str.count("x") 输出字符,不够的使用指定的字符补上,字符居中:a_str.center(50,"-") 判断字符串以什么结尾:a_str.endwith("xx") 将字符串中的tab转换为指定数目的空格:a_str.expandtabs(tabsize=30) 查找指定字符

javascript中对字符串的操作总结

没听过一句话吗?程序员的世界,不处理字符串就是处理数组.这是群里的一位前辈和我说的,显然这和我之前理解的DOM是javascript的核心的不同的,看了几个面试题的内容,感觉前辈说的话非常的有道理,因此总结下,javascript中对字符串的操作. String类型 首先字符串类型是基本类型,但是在这里我们所说的是字符串的对象包装类型.因为只有引用类型才会有属性和方法.实际上每读取一个基本类型的同时都会创建一个对应的基本包装类型,从而让我们能够调用一些方法来操作数据.1.charAt() 和 c

【2017-04-01】JS字符串的操作、时间日期的操作、函数、事件、动画基础

一.字符串的操作 1.转大写: s.toLowerCase(); 2.转大写: s.toUpperCase(); 3.字符串的截取: s.substr(3,4);      -从索引3开始截取,截取4位.索引从0开始. 4.将字符串按指定的字符拆开: s.split(",");             引号内放指定的字符.返回的是一个数组. 5.字符串长度: s.length; 6.字符串中一个字符的索引: s.indexOf("world");      worl

人月到底有多少神话色彩

  台上一分钟,台下十年功 宝剑锋从磨砺出,梅花香自苦寒来:不经一番寒彻骨,哪得梅花扑鼻香:业精于勤而荒于嬉,行成于思而毁于随.不积跬步,无以至千里:不积小流,无以成江海.骐骥一跃,不能十步:驽马十驾,功在不舍.千百年来,先人的经验都在告诉我们台上一分钟,台下十年功,这句话本意指在台上表演的时间往往只有短短的一分钟,但为了台上这一分钟的表演时间,需要付出十年的艰辛努力.这些都强调了基础的重要性,编程就好比练功,如果学习.net,mfc,vb等具体的语言和工具是外功或者是招式,对基础的学习就是内功

javascript中字符串常用操作总结、JS字符串操作大全

字符串的操作在js中非常频繁,也非常重要.以往看完书之后都能记得非常清楚,但稍微隔一段时间不用,便会忘得差不多,记性不好是硬伤啊...今天就对字符串的一些常用操作做个整理,一者加深印象,二者方便今后温习查阅. String对象属性 (1) length属性 length算是字符串中非常常用的一个属性了,它的功能是获取字符串的长度.当然需要注意的是js中的中文每个汉字也只代表一个字符,这里可能跟其他语言有些不一样. var str = 'abc'; console.log(str.length);