深圳模具培訓/龍崗電腦培訓
哲遠教育
學設計選哲遠
0755-84586521

怎樣才能快速掌握課堂所學知識

前言

Java 虛擬機的內存模型分為兩部分:一部分是線程共享的,包括 Java 堆和方法區;另一部分是線程私有的,包括虛擬機棧和本地方法棧,以及程序計數器這一小部分內存。今天我就 Java 虛擬機棧做一些比較淺的探究。

熟悉 Java 的同學應該都知道了,JVM 是基于棧的。但是這個“棧” 具體指的是什么?難道就是虛擬機棧?想要回答這個問題我們先要從虛擬機棧的結構談起。

虛擬機棧

何為虛擬機棧

虛擬機棧的棧元素是棧幀,當有一個方法被調用時,代表這個方法的棧幀入棧;當這個方法返回時,其棧幀出棧。因此,虛擬機棧中棧幀的入棧順序就是方法調用順序。什么是棧幀呢?棧幀可以理解為一個方法的運行空間。它主要由兩部分構成,一部分是局部變量表,方法中定義的局部變量以及方法的參數就存放在這張表中;另一部分是操作數棧,用來存放操作數。我們知道,Java 程序編譯之后就變成了一條條字節碼指令,其形式類似匯編,但和匯編有不同之處:匯編指令的操作數存放在數據段和寄存器中,可通過存儲器或寄存器尋址找到需要的操作數;而 Java 字節碼指令的操作數存放在操作數棧中,當執行某條帶 n 個操作數的指令時,就從棧頂取 n 個操作數,然后把指令的計算結果(如果有的話)入棧。因此,當我們說 JVM 執行引擎是基于棧的時候,其中的“棧”指的就是操作數棧。舉個簡單的例子對比下匯編指令和 Java 字節碼指令的執行過程,比如計算 1 + 2,在匯編指令是這樣的:

mov ax,1;把1放入寄存器 axadd ax,2;用 ax 的內容和2相加后存入 ax

而 JVM 的字節碼指令是這樣的:

iconst_1 //把整數 1 壓入操作數棧iconst_2 //把整數 2 壓入操作數棧iadd //棧頂的兩個數相加后出棧,結果入棧

由于操作數棧是內存空間,所以字節碼指令不必擔心不同機器上寄存器以及機器指令的差別,從而做到了平臺無關。

注意,局部變量表中的變量不可直接使用,如需使用必須通過相關指令將其加載至操作數棧中作為操作數使用。比如有一個方法 void foo(),其中的代碼為:int a = 1 + 2; int b = a + 3;,編譯為字節碼指令就是這樣的:

iconst_1 //把整數 1 壓入操作數棧iconst_2 //把整數 2 壓入操作數棧iadd //棧頂的兩個數出棧后相加,結果入棧;實際上前三步會被編譯器優化為:iconst_3istore_1 //把棧頂的內容放入局部變量表中索引為 1 的 slot 中,也就是 a 對應的空間中iload_1 // 把局部變量表索引為 1 的 slot 中存放的變量值(3)加載至操作數棧iconst_3 iadd //棧頂的兩個數出棧后相加,結果入棧istore_2 // 把棧頂的內容放入局部變量表中索引為 2 的 slot 中,也就是 b 對應的空間中return// 方法返回指令,回到調用點

需要說明的是,局部變量表以及操作數棧的容量的較大值在編譯時就已經確定了,運行時不會改變。并且局部變量表的空間是可以復用的,例如,當指令的位置超出了局部變量表中某個變量 a 的作用域時,如果有新的局部變量 b 要被定義,b 就會覆蓋 a 在局部變量表的空間。

盜用別人的圖以讓大家對虛擬機棧有個直觀的認識(其中小字體 Stack 指的的是虛擬機棧,Frame 是棧幀,Local variables 是局部變量表,Operand Stack 是操作數棧):

由虛擬機棧引出的問題

看完上面的代碼大家可能會有幾點疑惑:什么是 slot?那些指令是什么意思?為什么 a 對應的 slot 的索引值不是從零開始的,它明明是靠前個定義的變量啊?

對于這些問題我們一個個來解決。

什么是 slot

首先什么是 slot?slot 是局部變量表中的空間單位,虛擬機規范中有規定,對于 32 位之內的數據,用一個 slot 來存放,如 int,short,float 等;對于 64 位的數據用連續的兩個 slot 來存放,如 long,double 等。引用類型的變量 JVM 并沒有規定其長度,它可能是 32 位,也有可能是 64 位的,所以既有可能占一個 slot,也有可能占兩個 slot。

JVM 字節碼指令

第二個問題,那些指令是什么意思?

指令格式

首先我們要理解 Java 指令的格式,Java 的指令以字節為單位,也就是一個字節代表一條指令。比如 iconst_1 就是一條指令,它占一個字節,那么自然 Java 指令不會超過 256 條。實際上 Java 指令目前定義了 200 多條。指令雖然是一個字節,但是它也可以帶自己的操作數。JVM 中有這樣一條指令 putstatic,其作用是給特定的的靜態字段賦值。但是給哪個字段賦值呢?僅僅通過這條指令并不能說明,那么只有通過操作數來指定了。緊跟在 putstatic 后面的兩個字節就是它的操作數,這個操作數是一個索引值,指向運行時常量池中該靜態字段對應的符號引用。由于符號引用包含了該字段的基本信息,如所屬類、簡單名稱以及描述符,因此 putstatic 指令就知道是給哪個類的哪個字段賦值了。

指令的操作數分兩種:一種是嵌入在指令中的,通常是指令字節后面的若干個字節;另一種是存放在操作數棧中的。為了區別,我們把前者叫做嵌入式操作數,把后者叫做棧內操作數。這兩者的區別是:嵌入式操作數是在編譯時就已經確定的,運行時不會改變,它和指令一樣存放于類文件方法表的 Code 屬性中;而操作數是運行時確定的,即程序在執行過程中動態生成的。拿 putstatic 指令來說,它有一個嵌入式操作數,該操作數是一個索引值(前面已經提到),它由兩個字節組成,緊跟在 putstatic 對應的字節之后;同時它還有一個棧內操作數,位于操作數棧的棧頂,這個操作數就是要賦給靜態字段的值,其對應的字節數根據靜態字段的類型決定。如果靜態字段的類型是 short、int、boolean、char 或者 byte,那么這個操作數就必須是 int 類型,即由棧頂的 4 個字節組成;如果是 float、double 或者 long 類型,那么操作數就是相應的類型,即由棧頂的 4 個、8 個 或者 8 個 字節組成;如果靜態字段是引用類型,那么這個操作數的類型也必須是引用類型,即由棧頂的 8 個字節組成。

再舉一個例子。iconst_<i> 代表了一個指令族,它的意思是把整數 i 放入操作數棧中,i 的范圍是(m1, 0, 1, 2, 3, 4, 5),其中 m1 代表的是 -1。注意,這里的 i 并不是指令的操作數(即非嵌入式操作數,也非棧內操作數),如 iconst_1、iconst_2 和 iconst3 都是由一個字節組成的字節碼指令。我們可以把 i 可以看作是指令的 “隱含操作數”,即指令本身就蘊含了操作數。如果整數 i 超過 [-1, 5] 這個范圍,就不能用 iconst<i> 表示了,因為僅一個字節的字節碼指令不可能蘊含所有的整數。此時就需要 bipush 這條指令了,這條指令有一個嵌入式操作數,由一個字節組成,用來表示要放入棧頂的那個整數,該整數放入棧頂時通過擴展符號位變為 32 位的整型。但是一個字節也表示不了所有的整數,如果整數值超過一個字節所能表示的范圍,就只能通過 ldc 這條指令了,這條指令帶有一個字節的嵌入式操作數,它代表的是一個指向運行時常量池中 Constant_Integer_info 類型常量的索引,通過索引的方式引用運行時常量池中的整數,再大的整數也不怕了。





文章分類: 相關問答手記文章
首頁            熱門課程             職業路徑             實戰課程             文章問答    
 聯系地址:深圳市龍崗區龍平東路205號(雙龍老街平岡中學斜對面)新龍商務大廈512
聯系電話:0755-84586521 15502025011(微信同號)  QQ1411876615  719382736

掃查看手機版網站

在線客服
 
 
 
 
 工作時間
周一至周五 :8:30-17:30
周六至周日 :9:00-17:00
 聯系方式
客服熱線:0755-84586521
電話微信:15502025011