JVM字符串常量池及String的intern方法詳解？

猿友 2020-09-03 11:11:15 瀏覽數(shù) (2707)

反饋

文章轉(zhuǎn)載自公眾號：程序新視界

本篇文章基于字符串常量池的存儲及在使用 intern方法時所引起的內(nèi)存變化進行一步深層次的講解。

重點內(nèi)容：當(dāng)字符串調(diào)用 intern方法方法后，再進行字符串的比較，會發(fā)生什么變化？

本文內(nèi)容均以HotSpot虛擬機為基礎(chǔ)講解。

面試題

先通過一個面試題形象的了解一下我們本篇文章要講的內(nèi)容的呈現(xiàn)形式：

String s1 = new String("he") + new String("llo");
String s2 = new String("h") + new String("ello");


String s3 = s1.intern();
String s4 = s2.intern();
System.out.println(s1 == s3);
System.out.println(s1 == s4);

執(zhí)行上面的代碼，會發(fā)現(xiàn)打印的結(jié)果都是 true 。那么，為什么本來不相等的字符串，調(diào)用了intern方法之后便相等了呢？下面我們就來逐步分析這其中的底層實現(xiàn)。

intern方法的作用

intern()方法的功能定義：

（1）如果當(dāng)前字符串內(nèi)容存在于字符串常量池（即equals()方法為true，也就是內(nèi)容一樣），那直接返回此字符串在常量池的引用；

（2）如果當(dāng)前字符串不在字符串常量池中，那么在常量池創(chuàng)建一個引用并指向堆中已存在的字符串，然后返回常量池中的引用。

簡單說intern方法就是判斷并將字符串是否存在于字符串常量池，如果不存在則創(chuàng)建，存在則返回。

字符串常量池

在HotSpot中實現(xiàn)字符串常量池功能的是一個StringTable類，它是一個Hash表，默認值大小長度是1009。在每個HotSpot虛擬機的實例中只有一份，被所有的類共享。字符串常量由一個個字符組成，放在了StringTable上。

JDK6及之前版本，字符串常量池是放在Perm Gen區(qū)(方法區(qū))中。StringTable的長度是固定的，長度是1009，當(dāng)String字符串過多時會造成hash沖突，導(dǎo)致鏈表過長，性能大幅度下降。此時字符串常量池里面放的全部是字符串常量（字面值）。

由于永久代的空間有限且固定，JDK6的存儲模式很容易造成OutOfMemoryError。

而JDK7時正在著手去永久代的工作，因此字符串常量池被放在了堆中。此時，即使堆的大小也是固定的，但對于應(yīng)用調(diào)優(yōu)工作，只需要調(diào)整堆大小就行了。

在JDK7中字符串常量池不僅僅可以存放字符串常量，還可以存放字符串的引用。也就是說，堆中的字符串的引用可以作為常量池的值而存在。

字符串池化流程分析

在了解了上面的基礎(chǔ)理論，我們下面以圖文相結(jié)合的形式來逐步演示字符串池化的流程和分類。以下實例以JDK8版本為基礎(chǔ)來進行分析講解。

當(dāng)我們通過雙引號聲明一個字符串：

String wechat = "程序新視界";

此時，雙引號內(nèi)的字符串會被直接存儲在字符串常量池中。

JVM字符串常量池及String的intern方法詳解？

關(guān)于上面的存儲結(jié)構(gòu)，我們已經(jīng)在之前文章中提到，不再過多解釋。下面如果我們再聲明同樣的字符串看看會有什么樣的變化。

String wechat = "程序新視界";
String wechat1 = "程序新視界";

上述代碼中聲明wechat1時，會發(fā)現(xiàn)常量池中已經(jīng)存在了對應(yīng)的字符串，則不會再重新創(chuàng)建，只是把對應(yīng)的引用返回給wechat1。對應(yīng)結(jié)構(gòu)圖如下：

JVM字符串常量池及String的intern方法詳解？

此時，如果直接用雙等號比較wechat和wechat1肯定是相等的，因為它們的引用和字面值都是相同的。

上面是直接雙引號賦值的情況，那么如果通過 new 的形式創(chuàng)建字符串對應(yīng)的流程又是如何呢？前面文章已經(jīng)講到這分兩種情況：常量池存在對應(yīng)的值和不存在對應(yīng)的值。

String wechat2 = new String("程序新視界");

如果存在對應(yīng)的值，此時會先在堆中創(chuàng)建一個針對wechat2變量的對象引用，然后將這個對象引用指向字符串常量池中已經(jīng)存在的常量。

JVM字符串常量池及String的intern方法詳解？

此時直接使用雙等號比較wechat和wechat2變量肯定是不相等的，而通過equals方法進行對比字面值則是相等的。

另外一種情況就是通過 new 創(chuàng)建時，字符串常量池中并不存在對應(yīng)的常量。這種情況會現(xiàn)在字符串常量池中創(chuàng)建一個字符串常量，然后再在堆中創(chuàng)建一個字符串，持有常量池中對應(yīng)字符串的引用。并把堆中對象的地址返回給wechat2。最終效果圖依舊如上圖。

在此時，如果不是直接new字符串賦值，而是通過+號操作，情況就有所不同。

String s1 = "程序";
String wechat3 = new String(s1 + "新視界");

上述代碼 s1 會存入常量池，而wechat3的值則由于JVM編譯時采用了StringBuilder進行加號的拼接，只會在堆中創(chuàng)建一個String對象，并不會在常量池中存儲對應(yīng)的字符串。

JVM字符串常量池及String的intern方法詳解？

此時的情況已經(jīng)涉及到我們面試題中創(chuàng)建字符串的情況了。那么，下面我們就通過intern方法進行池化操作，看看字符串常量池的具體變化。

還以上面的代碼為例，此時wechat、wechat1、wechat2三個變量和wechat3直接用雙等號比較肯定是不相等的。下面對wechat3進行intern池化處理。

String s1 = "程序";
String wechat3 = new String(s1 + "新視界");
wechat3 = wechat3.intern();

此時會發(fā)現(xiàn)wechat、wechat1兩個變量與wechat3的值相等了。由于wechat和wechat1其實是一個，這里只以wechat和wechat3的比較為例來分析一下這個流程。

在沒有調(diào)用intern方法之前內(nèi)存的狀態(tài)是下圖（忽略掉s1部分）這樣的：

JVM字符串常量池及String的intern方法詳解？

看上圖它們的值不相等也就不奇怪了。下面對wechat3進行池化處理，并把池化的結(jié)果賦值給wechat3，就是上面的代碼。內(nèi)存結(jié)構(gòu)會發(fā)生如下變化：

JVM字符串常量池及String的intern方法詳解？

此時，再判斷對應(yīng)的兩個值，因為引用和字面值全部相同，因此便相等了。具體intern的判斷規(guī)則我們上面已經(jīng)知道，如果常量池中存在對應(yīng)的值，則直接返回引用。

那還有另外一種情況，就是常量池中不存在對應(yīng)的值會是如何處理的呢？先看如下代碼：

String s2 = "關(guān)注";
String wechat4 = new String(s2 + "公眾號");
wechat4 = wechat4.intern();

在調(diào)用intern之前的操作我們前面已經(jīng)說過，會在堆中創(chuàng)建一個String對象，而常量池中并不會存儲一份，與wechat3的圖一樣。

此時常量池中并未存在對應(yīng)的字符串，此時調(diào)用intern方法之后，內(nèi)存結(jié)構(gòu)如下：

JVM字符串常量池及String的intern方法詳解？

經(jīng)intern方法之后，常量池中存了堆中對應(yīng)字符串的引用。對照上面說的，JDK7及之后字符串常量池中可以存儲引用了。

需要注意的是，當(dāng)字符串常量池中并不存在對應(yīng)字符串時，調(diào)用intern方法返回的地址為堆中的地址，對應(yīng)圖中的0x99。而wechat4本來地址指向的就是堆中的地址，因此不會發(fā)生變化。

此時如果再定義一個雙引號賦值的wechat5，如下代碼：

String s2 = "關(guān)注";
String wechat4 = new String(s2 + "公眾號");
wechat4 = wechat4.intern();


String wechat5 = "關(guān)注公眾號";
System.out.println(wechat4 == wechat5);

變量wechat5初始化時發(fā)現(xiàn)字符串常量池中已經(jīng)存在了一個引用，那么wechat5會直接指向這個引用，也就是wechat5和wechat4一樣，都指向內(nèi)存中的String對象。

JVM字符串常量池及String的intern方法詳解？

小結(jié)

上面這個演示實例時需要注意的重點是intern方法返回的引用地址。如果字符串常量池中已經(jīng)存在對應(yīng)的字符串時，此時返回的是字符串常量的地址【常量池中存儲的是字符串】，如果字符串常量池中不存在對應(yīng)的字符串，此時會把堆中的引用放在常量池對應(yīng)的位置【常量池中存儲的是堆中字符串的引用】，此時intern返回的是堆中字符串對應(yīng)的引用。

搞清楚了上面的返回邏輯再看最初的代碼：

String s1 = new String("he") + new String("llo");
String s2 = new String("h") + new String("ello");


String s3 = s1.intern();
String s4 = s2.intern();
System.out.println(s1 == s3);
System.out.println(s1 == s4);

其中 s1 為堆中字符串“hello”的地址；s2 為堆中另外一個“hello”字符串的地址。當(dāng)s1.intern()，常量池中存儲了 s1 的地址，此時s1.intern()返回的也是 s1 的地址，因此s1=s3，都是同一個地址嘛。

然后執(zhí)行s2.intern()，此時常量池中已經(jīng)有 hello 字符串，類型為引用且指向 s1 的地址，執(zhí)行之后返回的便是 s1 的地址，賦值給 s4 ，因此 s1 和 s4 也指向同一個地址，因此相等。

通過上面的更深層次的分析，想必大家對字符串常量、字符串常量池以及intern方法有了更加深刻的理解。相關(guān)的面試題如果按照這個思路分析，基本上都可以進行準確解答了。

以上就是W3Cschool編程獅關(guān)于JVM字符串常量池及String的intern方法詳解？的相關(guān)介紹了，希望對大家有所幫助。

Java

0 人點贊

JVM字符串常量池及String的intern方法詳解？

面試題

intern方法的作用

字符串常量池

字符串池化流程分析

小結(jié)

JVM字符串常量池及String的intern方法詳解？