java字符串拼接与性能分析详解

2022-10-20,,,,

假设有一个字符串,我们将对这个字符串做大量循环拼接操作,使用”+”的话将得到最低的性能。但是究竟这个性能有多差?如果我们同时也把stringbuffer,stringbuilder或string.concat()放入性能测试中,结果又会如何呢?本文将会就这些问题给出一个答案!

我们将使用per4j来计算性能,因为这个工具可以给我们一个完整的性能指标集合,比如最小,最大耗时,统计时间段的标准偏差等。在测试代码中,为了得到一个准确的标准偏差值,我们将执行20个拼接”*”50,000次的测试。下面是我们将使用到的拼接字符串的方法:
复制代码 代码如下:
concatenation operator (+)
string concat method – concat(string str)
stringbuffer append method – append(string str)
stringbuilder append method – append(string str)

最后,我们将看看字节码,来研究这些方法到底是如何执行的。现在,让我们先开始来创建我扪的类。注意为了计算每个循环的性能,代码中的每段测试代码都需要用per4j库进行封装。首先我们先定义迭代次数

复制代码 代码如下:
private static  final int  outer_iteration=20; 
private static final int inner_iteration=50000; 

接下来,我们将使用上述4个方法来实现我们的测试代码。

复制代码 代码如下:
string addteststr = ""; 

string concatteststr = ""; 

stringbuffer concattestsb = null; 

stringbuilder concattestsbu = null; 

for (int outerindex=0;outerindex<=outer_iteration;outerindex++) { 

    stopwatch stopwatch = new loggingstopwatch("stringaddconcat"); 

    addteststr = ""; 

    for (int innerindex=0;innerindex<=inner_iteration;innerindex++) 

    addteststr += "*"; 

    stopwatch.stop(); 

}       

for (int outerindex=0;outerindex<=outer_iteration;outerindex++) { 

    stopwatch stopwatch = new loggingstopwatch("stringconcat"); 

    concatteststr = ""; 

    for (int innerindex=0;innerindex<=inner_iteration;innerindex++) 

    concatteststr.concat("*"); 

    stopwatch.stop(); 

for (int outerindex=0;outerindex<=outer_iteration;outerindex++) { 

    stopwatch stopwatch = new loggingstopwatch("stringbufferconcat"); 

    concattestsb = new stringbuffer(); 

    for (int innerindex=0;innerindex<=inner_iteration;innerindex++) 

    concattestsb.append("*"); 

    stopwatch.stop(); 

for (int outerindex=0;outerindex<=outer_iteration;outerindex++) { 

    stopwatch stopwatch = new loggingstopwatch("stringbuilderconcat"); 

    concattestsbu = new stringbuilder(); 

    for (int innerindex=0;innerindex<=inner_iteration;innerindex++) 

    concattestsbu.append("*"); 

    stopwatch.stop(); 

接下来通过运行程序来生成性能指标。我的运行环境是64位的windown7操作系统,32位的jvm(7-ea) 带4gb内存,双核quad 2.00ghz的cpu的机器

结果非常完美如我们想象的那样。唯一比较有趣的事情是为什么string.concat也很不错,我们都知道,string是一个常类(初始化后就不会改变的类),那么为什么concat的性能会更好一些呢。(译者注: 其实原文作者的测试代码有问题,对于concat()方法的测试代码应该写成 concatteststr=concatteststr.concat(“*”)才对。)为了回答这个问题,我们应该看看concat反编译出来的字节 码。在本文的下载包里面包含了所有的字节码,但是现在我们先看一下concat的这个代码片段:

复制代码 代码如下:
46:  new #6; //class java/lang/stringbuilder
49:  dup
50:  invokespecial   #7; //method java/lang/stringbuilder."<init>":()v
53:  aload_1
54:  invokevirtual   #8; //method java/lang/stringbuilder.append:
         (ljava/lang/string;)ljava/lang/stringbuilder;
57:  ldc #9; //string *
59:  invokevirtual   #8; //method java/lang/stringbuilder.append:
         (ljava/lang/string;)ljava/lang/stringbuilder;
62:  invokevirtual   #10; //method java/lang/stringbuilder.tostring:()
         ljava/lang/string;
65:  astore_1
66:  iinc    7, 1
69:  goto    38

这段代码是string.concat()的字节码,从这段代码中,我们可以清楚的看到,concat()方法使用了 stringbuilder,concat()的性能应该和stringbuilder的一样好,但是由于额外的创建stringbuilder和 做.append(str).append(str).tostring()的操作,使得concate的性能会受到一些影响,所以 stringbuilder和string cancate的时间是1.8和3.3。

因此,即时在做最简单的拼接时,如果我们不想创建stringbuffer或stringbuilder实例使,我们也因该使用concat。但是对于大量的字符串拼接操作,我们就不应该使用concat(译者注:因 为测试代码功能上并不完全等价,更换后的测试代码concat的平均处理时间是1650.9毫秒。这个结果在原文的评论里面。),因为concat会降低 你程序的性能,消耗你的cpu。因此,在不考虑线程安全和同步的情况下,为了获得最高的性能,我们应尽量使用stringbuilder。

《java字符串拼接与性能分析详解.doc》

下载本文的Word格式文档,以方便收藏与打印。