String内存分布和创建时对象生成情况等常见问题详解-一一网

这是我参与新手入门的第一篇文章

摘要：

String概述
“+”，StringBuffer，StringBuilder
intern方法
String内存分布和创建时对象生成情况等常见问题详解

String概述

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    /** The value is used for character storage. */
    private final char value[];

    /** Cache the hash code for the string */
    private int hash; // Default to 0

    /** use serialVersionUID from JDK 1.0.2 for interoperability */
    private static final long serialVersionUID = -6849794470754667710L;
复制代码

以上是jdk1.8中对String类的定义，由此我们可以得出以下几个结论：

String类被final关键字修饰，意味着String类不能被继承，并且它的成员方法都默认为final方法；字符串一旦创建就不能再修改。
String类实现了Serializable、CharSequence、 Comparable接口。
String实例的值是通过字符数组实现字符串存储的。

“+”，StringBuffer，StringBuilder

java中当”+” 前后出现字符串时表示字符串拼接的操作，因为String是final修饰的，创建后就不可变，所以“+”底层实际是创建了一个StringBuilder对象，然后调用append方法去拼接字符串，再调用toString方法生成一个新的String。
只有使用引号包含文本的方式创建的String对象之间使用“+”连接产生的新对象才会被加入字符串池中。
对于所有包含new方式新建对象（包括null）的“+”连接表达式，它所产生的新对象都不会被加入字符串池中。
StringBuffer和StringBuilder都是可变的字符序列
StringBuffer的append方法使用了synchronized，所以是线程安全的，StringBuilder是线程不安全的。所以相应的，StringBuilder的效率比StringBuffer快。

intern方法

/**
     * Returns a canonical representation for the string object.
     * <p>
     * A pool of strings, initially empty, is maintained privately by the
     * class {@code String}.
     * <p>
     * When the intern method is invoked, if the pool already contains a
     * string equal to this {@code String} object as determined by
     * the {@link #equals(Object)} method, then the string from the pool is
     * returned. Otherwise, this {@code String} object is added to the
     * pool and a reference to this {@code String} object is returned.
     * <p>
     * It follows that for any two strings {@code s} and {@code t},
     * {@code s.intern() == t.intern()} is {@code true}
     * if and only if {@code s.equals(t)} is {@code true}.
     * <p>
     * All literal strings and string-valued constant expressions are
     * interned. String literals are defined in section 3.10.5 of the
     * <cite>The Java&trade; Language Specification</cite>.
     *
     * @return  a string that has the same contents as this string, but is
     *          guaranteed to be from a pool of unique strings.
     */
    public native String intern();
复制代码

intern方法是一个本地方法。作用就是调用该方法时先去字符串常量池中查找是否有相等的（equals）值，有就直接返回常量池中的引用。没有就将该字符串存入字符串常量池，再返回字符串常量池中的引用。

注意：jkd1.6之前常量池和堆是分开的，所以这里是在常量池里存的的具体的值。jdk1.6之后常量池和堆在一起，这里常量池中保存的是堆中对象的引用。

String内存分布几生成几个对象等常见问题详解

由于字符串对象的大量使用(它是一个对象，一般而言对象总是在heap分配内存)，Java中为了节省内存空间和运行时间(如比较字符串时，==比equals()快)，在编译阶段就把所有的字符串文字放到一个文字池(pool of literal strings)中，而运行时文字池成为常量池的一部分。文字池的好处，就是该池中所有相同的字符串常量被合并，只占用一个空间。

主要就是两种情况：通过常量池创建和通过new创建

通过常量池创建，JVM会首先检查在字符串常量池，如果在字符串常量池中存在了该字符串，此时就会将该字符串对象的地址值赋值给引用。如果字符串不在常量池中，就会在常量池中创建字符串,然后将字符串对象的地址值交给引用。所以最多只会创建一个对象。
通过new创建，JVM会首先检查字符串常量池,如果字符串已经存在常量池中，直接复制堆中这个对象的副本，然后将堆中的地址值赋给引用，不会在字符串常量池中创建对象。如果字符串不存在常量池中，就会实例化该字符串并且将其放到常量池中，然后在堆中复制该对象的副本，并将对象的地址值交给引用。所以可能生成一个或者两个对象。

String s1 = "a";
String s3 = new String("a");
String s4 = new String("b");
String s2 = "b";
String s5 = "a" + "b";
String s6 = "a" + s4;
String s7 = s1 + s2;
String s8 = "ab";
final String s9 = "e";
final String s10 = "f";
String s11 = s9 + s10;
String s12 = "ef";
System.out.println(s1 == s3);        // false
System.out.println(s1.equals(s3));	 // true
System.out.println(s5 == s6);		// false
System.out.println(s5 == s7);		// false
System.out.println(s5.equals(s7));	// true
System.out.println(s5 == s8);		// true
System.out.println(s11 == s12);		// true
复制代码

s1 在常量池中生成了一个对象
s3 常量池中已经有了，所以只在堆中创建了一个对象
s4 常量池和堆中各创建了一个对象，共两个对象（这两个对象的字符串数组是同一个）
s2 常量池中已经有了，没有重新创建对象
s5 编译时将常量拼接好了，然后在常量池中创建了一个对象
s6 生成一个StringBuilder对象用来拼接，最后toSting在堆中生成一个新的对象，共两个对象
s7 与s6一样
s8 常量池中已经有了，没有重新创建对象
s9，s10都是在常量池中生成一个对象
s11 使用final修饰的变量，在编译时替换成常量了，然后将常量拼接好在常量池中创建了一个对象

String s1 = new String("g");
s1.intern();
String s2 = "g";
System.out.println(s1 == s2);			// false
System.out.println(s1.intern() == s2);	 // true

String s3 = new String("h") + new String("i");
s3.intern();
String s4 = "hi";
System.out.println(s3 == s4);			// true
System.out.println(s3.intern() == s4);	 // true

String s5 = new String("j") + new String("k");
String s6 = "jk";
s5.intern();
System.out.println(s5 == s6);			// false
System.out.println(s5.intern() == s6);	 // true
复制代码

s1 在常量池中和堆中各创建了一个对象
s1.intern调用时发现常量池中已经存在“g”了，所以返回常量池中“g”的引用
s2 创建时发现常量池中已经存在了，不会生成新的对象，直接指向常量池的对象
s1和s2指向不同的对象，所以不相等。s1.intern指向常量池的对象，和s2相等
s3 在堆中生成两个匿名对象，一个StringBuilder对象，一个toString生成的对象，常量池中两个对象，共六个对象。最终生成的对象不会存放到字符串常量池中（参考上面“+”的定义）。
s3.intern调用时发现常量池中没有“hi”，将堆中“hi”对象的地址存放在常量池中，所以s3.intern最终还是指向堆中的对象。
s4 创建时发现常量池中已经存在了，直接返回常量池中的引用，所以s4最终也指向了堆中的“hi”对像。所以s3==s4

，s3.intern() == s4
s5 创建和s3过程一样
s6 创建时发现常量池中没有，会在常量池中创建一个“jk”对象
s5.intern调用时，发现常量池中已经存在“jk”，直接返回常量池中的对象地址。
所以s5和s6是指向不同的对象