尽可能使用堆栈变量
Peter Haggar IBM 高级软件工程师 2000 年 2 月
编者按:这几篇文章是从《Practical Java》(由 Addison-Wesley 出版)一书节选而来的。您可以从 Borders.com 订购该书。请阅读我们对作者 Peter Haggar 的采访。
如果您频繁存取变量,就需要考虑从何处存取这些变量。变量是 static 变量,还是堆栈变量,或者是类的实例变量?变量的存储位置对存取它的代码的性能有明显的影响?例如,请考虑下面这段代码:
class StackVars { private int instVar; private static int staticVar;
//存取堆栈变量 void stackAccess(int val) { int j=0; for (int i=0; i<val; i++) j += 1; }
//存取类的实例变量 void instanceAccess(int val) { for (int i=0; i<val; i++) instVar += 1; }
//存取类的 static 变量 void staticAccess(int val) { for (int i=0; i<val; i++) staticVar += 1; } }
这段代码中的每个方法都执行相同的循环,并反复相同的次数。唯一的不同是每个循环使一个不同类型的变量递增。方法 stackAccess 使一个局部堆栈变量递增,instanceAccess 使类的一个实例变量递增,而 staticAccess 使类的一个 static 变量递增。
instanceAccess 和 staticAccess 的执行时间基本相同。但是,stackAccess 要快两到三倍。存取堆栈变量如此快是因为,JVM 存取堆栈变量比它存取 static 变量或类的实例变量执行的操作少。请看一下为这三个方法生成的字节码:
Method void stackAccess(int) 0 iconst_0 //将 0 压入堆栈。 1 istore_2 //弹出 0 并将它存储在局部分变量表中索引为 2 的位置 (j)。 2 iconst_0 //压入 0。 3 istore_3 //弹出 0 并将它存储在局部变量表中索引为 3 的位置 (i)。 4 goto 13//跳至位置 13。 7 iinc 2 1 //将存储在索引 2 处的 j 加 1。 10 iinc 3 1 //将存储在索引 3 处的 i 加 1。 13 iload_3//压入索引 3 处的值 (i)。 14 iload_1//压入索引 1 处的值 (val)。 15 if_icmplt 7//弹出 i 和 val。如果 i 小于 val,则跳至位置 7。 18 return //返回调用方法。
Method void instanceAccess(int) 0 iconst_0 //将 0 压入堆栈。 1 istore_2 //弹出 0 并将它存储在局部变量表中索引为 2 的位置 (i)。 2 goto 18//跳至位置 18。 5 aload_0//压入索引 0 (this)。 6 dup//复制堆栈顶的值并将它压入。 7 getfield #19 <Field int instVar> //弹出 this 对象引用并压入 instVar 的值。 10 iconst_1 //压入 1。 11 iadd //弹出栈顶的两个值,并压入它们的和。 12 putfield #19 <Field int instVar> //弹出栈顶的两个值并将和存储在 instVar 中。 15 iinc 2 1 //将存储在索引 2 处的 i 加 1。 18 iload_2//压入索引 2 处的值 (i)。 19 iload_1//压入索引 1 处的值 (val)。 20 if_icmplt 5//弹出 i 和 val。如果 i 小于 val,则跳至位置 5。 23 return //返回调用方法。
Method void staticAccess(int) 0 iconst_0 //将 0 压入堆栈。 1 istore_2 //弹出 0 并将它存储在局部变量表中索引为 2 的位置 (i)。 2 goto 16//跳至位置 16。 5 getstatic #25 <Field int staticVar> //将常数存储池中 staticVar 的值压入堆栈。 8 iconst_1 //压入 1。 9 iadd //弹出栈顶的两个值,并压入它们的和。 10 putstatic #25 <Field int staticVar> //弹出和的值并将它存储在 staticVar 中。 13 iinc 2 1 //将存储在索引 2 处的 i 加 1。 16 iload_2//压入索引 2 处的值 (i)。 17 iload_1//压入索引 1 处的值 (val)。 18 if_icmplt 5//弹出 i 和 val。如果 i 小于 val,则跳至位置 5。 21 return //返回调用方法。
查看字节码揭示了堆栈变量效率更高的原因。JVM 是一种基于堆栈的虚拟机,因此优化了对堆栈数据的存取和处理。所有局部变量都存储在一个局部变量表中,在 Java 操作数堆栈中进行处理,并可被高效地存取。存取 static 变量和实例变量成本更高,因为 JVM 必须使用代价更高的操作码,并从常数存储池中存取它们。(常数存储池保存一个类型所使用的所有类型、字段和方法的符号引用。)
通常,在第一次从常数存储池中访问 static 变量或实例变量以后,JVM 将动态更改字节码以使用效率更高的操作码。尽管有这种优化,堆栈变量的存取仍然更快。
考虑到这些事实,就可以重新构建前面的代码,以便通过存取堆栈变量而不是实例变量或 static 变量使操作更高效。请考虑修改后的代码:
class StackVars { //与前面相同... void instanceAccess(int val) { int j = instVar; for (int i=0; i<val; i++) j += 1; instVar = j; }
void staticAccess(int val) { int j = staticVar; for (int i=0; i<val; i++) j += 1; staticVar = j; } }
方法 instanceAccess 和 staticAccess 被修改为将它们的实例变量或 static 变量复制到局部堆栈变量中。当变量的处理完成以后,其值又被复制回实例变量或 static 变量中。这种简单的更改明显提高了 instanceAccess 和 staticAccess 的性能。这三个方法的执行时间现在基本相同,instanceAccess 和 staticAccess 的执行速度只比 stackAccess 的执行速度慢大约 4%。
这并不表示您应该避免使用 static 变量或实例变量。您应该使用对您的设计有意义的存储机制。例如,如果您在一个循环中存取 static 变量或实例变量,则您可以临时将它们存储在一个局部堆栈变量中,这样就可以明显地提高代码的性能。这将提供最高效的字节码指令序列供 JVM 执行。
作者简介 Peter Haggar 是 IBM 的高级软件工程师。他目前正在研究新兴的 Java 和因特网技术,并且是 IBM 实时 Java 参考实现的项目主持人。他有丰富的编程经验,从事过开发工具、类库和操作系统等方面的工作。在许多行业研讨会上,他也经常就 Java 和其他技术作技术性发言。他于 1987 年在纽约获得 Clarkson 大学计算机科学学士学位。可以通过 haggar@us.ibm.com 与他联系。
|