字符串拼接与性能分析

原文出处:http://www.venishjoe.net/2009/11/java-string-concatenation-and.html
转自:http://coolshell.cn/articles/2235.html



概述:本文主要研究的是JAVA的字符串拼接的性能,原文中的测试代码在功能上并不等价,导致concat的测试意义不大。不过原作者在评论栏给了新的concat结果,如果有兴趣的同学建议自己修改代码测试。

在JAVA中拼接两个字符串的最简便的方式就是使用操作符”+”了。如果你用”+”来连接固定长度的字符串,可能性能上会稍受影响,但是如果你是在循环中来”+”多个串的话,性能将指数倍的下降。假设有一个字符串,我们将对这个字符串做大量循环拼接操作,使用”+”的话将得到最低的性能。但是究竟这个性能有多差?如果我们同时也把StringBuffer,StringBuilder或String.concat()放入性能测试中,结果又会如何呢?本文将会就这些问题给出一个答案!
我们将使用Per4j来计算性能,因为这个工具可以给我们一个完整的性能指标集合,比如最小,最大耗时,统计时间段的标准偏差等。在测试代码中,为了得到一个准确的标准偏差值,我们将执行20个拼接”*”50,000次的测试。下面是我们将使用到的拼接字符串的方法:

 1 public class StringTest {
 2     private static final int OUT_MAX_INDEX = 20;
 3     private static final int INNER_MAX_INDEX = 50000;
 4
 5     public static void main(String[] args) {
 6         String addTestStr = "";
 7         String concatTestStr = "";
 8         StringBuffer concatTestSb = null;
 9         StringBuilder concatTestSbu = null;
10
11         for (int i = 0; i <= OUT_MAX_INDEX; i++) {
12             StopWatch stopWatch = new LoggingStopWatch("StringAddConcat");
13             addTestStr = "";
14             for (int j = 0; j <= INNER_MAX_INDEX; j++) {
15                 addTestStr += "*";
16             }
17             stopWatch.stop();
18         }
19
20         for (int i = 0; i <= OUT_MAX_INDEX; i++) {
21             StopWatch stopWatch = new LoggingStopWatch("StringConcat");
22             concatTestStr = "";
23             for (int j = 0; j <= INNER_MAX_INDEX; j++) {
24                 concatTestStr = concatTestStr.concat("*");
25             }
26             stopWatch.stop();
27         }
28
29         for (int i = 0; i <= OUT_MAX_INDEX; i++) {
30             StopWatch stopWatch = new LoggingStopWatch("StringBufferConcat");
31             concatTestSb = new StringBuffer();
32             for (int j = 0; j <= INNER_MAX_INDEX; j++) {
33                 concatTestSb.append("*");
34             }
35             stopWatch.stop();
36         }
37
38         for (int outerIndex = 0; outerIndex <= OUT_MAX_INDEX; outerIndex++) {
39             StopWatch stopWatch = new LoggingStopWatch("StringBuilderConcat");
40             concatTestSbu = new StringBuilder();
41             for (int innerIndex = 0; innerIndex <= INNER_MAX_INDEX; innerIndex++)
42                 concatTestSbu.append("*");
43             stopWatch.stop();
44         }
45     }
46 }

接下来通过运行程序来生成性能指标。我的运行环境是64位的Windown7操作系统,32位的JVM(7-ea) 带4GB内存,双核Quad 2.00GHz的CPU的机器.经过20次迭代后,我们得到如下的数据:

结果非常完美如我们想象的那样。唯一比较有趣的事情是为什么String.concat也很不错,我们都知道,String是一个常类(初始化后就不会改变的类),那么为什么concat的性能会更好一些呢。为了回答这个问题,我们应该看看concat反编译出来的字节码。在本文的下载包里面包含了所有的字节码,但是现在我们先看一下concat的这个代码片段:

[java]
new #6; //class java/lang/StringBuilder
dup
invokespecial #7; //Method java/lang/StringBuilder."<init>":()V
aload_1
invokevirtual #8; //Method java/lang/StringBuilder.append:
(Ljava/lang/String;)Ljava/lang/StringBuilder;
ldc #9; //String *
invokevirtual #8; //Method java/lang/StringBuilder.append:
(Ljava/lang/String;)Ljava/lang/StringBuilder;
invokevirtual #10; //Method java/lang/StringBuilder.toString:()
Ljava/lang/String;
astore_1
iinc 7, 1
goto 38
[/java]

这段代码是String.concat()的字节码,从这段代码中,我们可以清楚的看到,concat()方法使用了StringBuilder,concat()的性能应该和StringBuilder的一样好,但是由于额外的创建StringBuilder和做.append(str).append(str).toString()的操作,使得concate的性能会受到一些影响,所以StringBuilder和String Cancate的时间是1.8和3.3。



结论:
即使在做最简单的字符串拼接时,如果我们不想创建StringBuffer或StringBuilder实例,我们也因该使用concat,而不是直接用操作符”+”。但是对于大量的字符串拼接操作,我们就不应该使用concat(译者注:因为测试代码功能上并不完全等价,更换后的测试代码concat的平均处理时间是1650.9毫秒。这个结果在原文的评论里面。),因为concat会降低你程序的性能,消耗你的cpu。因此,在不考虑线程安全和同步的情况下,为了获得最高的性能,我们应尽量使用StringBuilder。

时间: 2024-08-26 05:59:30

字符串拼接与性能分析的相关文章

【转】Java 5种字符串拼接方式性能比较。

最近写一个东东,可能会考虑到字符串拼接,想了几种方法,但对性能未知,于是用Junit写了个单元测试. 代码如下: import java.util.ArrayList; import java.util.List; import org.apache.commons.lang.StringUtils; import org.junit.Test; import org.slf4j.Logger; import org.slf4j.LoggerFactory; public class TestS

Java 5种字符串拼接方式性能比较

http://blog.csdn.net/kimsoft/article/details/3353849 import java.util.ArrayList; import java.util.List; import org.apache.commons.lang.StringUtils; import org.junit.Test; import org.slf4j.Logger; import org.slf4j.LoggerFactory; public class TestStrin

java String拼接的方法选择及性能分析

String 拼接的方法选择 在拼接静态字符串时,尽量用 +,因为通常编译器会对此做优化,如: String test = "this " + "is " + "a " + "test " + "string" 编译器会把它视为: String test = "this is a test string" 在拼接动态字符串时,尽量用 StringBuffer 或 StringBuilde

Javascript字符串拼接小技巧

在Javascript中经常会遇到字符串的问题,但是如果要拼接的字符串过长就比较麻烦了. 如果是在一行的,可读性差不说,如果要换行的,会直接报错. 在此介绍几种Javascript拼接字符串的技巧. 字符串相加(+) var items = '<li class="details">' + '<span>Hello world</span>' + '</li>'; 利用反斜线拼接字符串 var items = '<li class=

字符串拼接性能优化

var htmlString = '<div class="container">' + '<ul id="news-list">', for (var i = 0; i < NEWS.length; i++) { htmlString += '<li><a href="'+NEWS[i].LINK +'">' + NEWS[i].TITLE + '</a></li>'

关于Boost,C Regex对短目标字符串正则匹配的性能分析

昨天对长目标字符串下的各种正则匹配库性能进行了总结,得出结论是Boost regex性能最佳.今天将其应用到项目当中,果不其然,长字符串匹配带来的性能损失基本没有了,当然,目前规模并不算太大,但是在可预计规模内Boost可以完全达到要求. 不过有一点,在Boost,C同时去除长字符串匹配的影响后,剩下都是短字符串匹配,发现Boost比C好的并不是好很多,例如10000+次短字符匹配中,其中包含匹配成功和不成功的,Boost regex+系统其他模块用时130ms左右,而C regex+系统其他模

C#中判断空字符串的3种方法性能分析

3种方法分别是:string a="";1.if(a=="")2.if(a==String.Empty)3.if(a.Length==0) 3种方法都是等效的,那么究竟那一种方法性能最高呢?本人用实验说明问题. 建立3个aspx页面(为什么用网页,主要是利用Microsoft Application Center Test ) WebForm1.aspxprivate void Page_Load(object sender, System.EventArgs e)

C# 字符串拼接性能探索 c#中+、string.Concat、string.Format、StringBuilder.Append四种方式进行字符串拼接时的性能

本文通过ANTS Memory Profiler工具探索c#中+.string.Concat.string.Format.StringBuilder.Append四种方式进行字符串拼接时的性能. 本文涉及程序为.NET Core 2.0控制台应用程序. 一.常量字符串拼接 private static void TestPerformance(Action action, int times) { Stopwatch sw = new Stopwatch(); sw.Start(); for(i

C 中判断空字符串的3种方法性能分析【月儿原创】

C#中判断空字符串的3种方法性能分析 作者:清清月儿 主页:http://blog.csdn.net/21aspnet/           时间:2007.4.28  3种方法分别是:string a="";1.if(a=="")2.if(a==String.Empty)3.if(a.Length==0) 3种方法都是等效的,那么究竟那一种方法性能最高呢?本人用实验说明问题. 建立3个aspx页面(为什么用网页,主要是利用Microsoft Application