Ildasm.exe 教學課程

這個教學課程提供了 .NET Framework SDK 中所附之 MSIL 反組譯工具 (Ildasm.exe) 的簡介。Ildasm.exe 工具可以剖析任何 .NET Framework .exe 或 .dll 組件 (Assembly),並且以人們可閱讀的 (Human-Readable) 格式顯示資訊。Ildasm.exe 不只會顯示 Microsoft Intermediate Language (MSIL) 程式碼,也會顯示包括介面在內的命名空間 (Namespace) 和型別。您可以使用 Ildasm.exe 來檢查 .NET Framework 的原生組件 (例如 Mscorlib.dll),以及其他人提供的或是您自行建立的 .NET Framework 組件。大部分 .NET Framework 開發人員都會認為 Ildasm.exe 是不可或缺的工具。

對於這個教學課程,請使用隨附在 SDK 中之 WordCount 範例的 Visual C# 版本。您也可以使用 Visual Basic 版本,但是這兩種語言所產生的 MSIL 將會不同,畫面影像也不盡相同。WordCount 位於 <FrameworkSDK>\Samples\Applications\WordCount\ 目錄中。若要建置 (Build) 和執行範例,請依照 Readme.htm 檔案中所列的指示進行。這個教學課程會使用 Ildasm.exe 來檢查 WordCount.exe 組件。

若要開始,請建置 WordCount 範例,並使用下列命令列將它載入 Ildasm.exe 中:

ildasm WordCount.exe

這樣便會使 Ildasm.exe 的視窗顯示出來,如下圖所示。

Ildasm.exe 視窗中的樹狀結構會顯示 WordCount.exe 內部包含的組件資訊清單資訊,以及四個全域類別型別:AppArgParserWordCountArgParserWordCounter

按兩下樹狀結構中的任何型別,即可看見型別的詳細資訊。在下圖中,已將 WordCounter 類別型別展開。

在上圖中,您可以看見所有的 WordCounter 成員。下列表格將說明每一個圖形符號所代表的意義。

符號 意義
詳細資訊
命名空間
類別
介面
數值類別
列舉型別
方法
靜態方法
欄位
靜態欄位
事件
屬性
資訊清單或類別資訊項目

按兩下 .class public auto ansi beforefieldinit 項目會顯示下列資訊:

在上圖中,您可以清楚地看出來,WordCounter 型別是從 System.Object 型別衍生而來。

WordCounter 型別還包含另外一個型別,名稱為 WordOccurrence。您可以將 WordOccurrence 型別展開,即可看見它的成員,如下圖所示。

從樹狀結構中可以看出來,WordOccurrence 實作了 System.IComparable 介面,更明確地講,就是 CompareTo 方法。不過,在後續的說明中,我們將略過 WordOccurrence 型別,而將焦點集中在 WordCounter 型別上。

您可以看到 WordCounter 型別含有五個 private 欄位:totalBytestotalCharstotalLinestotalWordswordCounter。前四個欄位是 int64 型別的執行個體 (Instance),而 wordCounter 欄位則是 System.Collections.SortedList 型別的參考。

在這些欄位之後,您可以看見方法。第一個方法 .ctor 是建構函式 (Constructor)。這個特殊的型別只有一個建構函式,但是其他型別則可以有多個建構函式,每一個的簽名碼 (Signature) 都不同。WordCounter 建構函式的傳回型別 (Return Type) 為 void (和所有建構函式一樣),而且不接受參數。如果按兩下建構函式方法,會出現新的視窗,它會顯示方法中所包含的 MSIL 程式碼,如下圖所示。

MSIL 程式碼實際上很容易閱讀和了解 (如需所有的詳細資訊,請參閱位於 <FrameworkSDK>\Tool Developers Guide\Docs 資料夾 Partition III CIL.doc 檔案中的 CIL Instruction Set Specification)。在最接近頂端的地方,您可以看見這個建構函式需要 50 個位元組的 MSIL 程式碼。從這個數字並不能判斷出 JIT 編譯器將會發出多少機器碼,因為它的大小是根據主機 CPU 和用來產生程式碼的編譯器而定。

Common Language Runtime 為堆疊架構。因此,若要執行任何作業,MSIL 程式碼會先將運算元推入虛擬堆疊中,然後執行運算子。運算子會將運算元從堆疊中抓取出來、執行所需的作業,然後將結果放回堆疊上。不論任何時候,這個方法推入虛擬堆疊上的運算元都不能超過八個。您只要查看出現在 MSIL 程式碼前面的 .maxstack 屬性,就可以辨識出這個數目。

現在,請檢查前面幾個 MSIL 指令,如下列四行:

IL_0000: ldarg.0 ; Load the object's 'this' pointer on the stack
IL_0001: ldc.i4.0 ; Load the constant 4-byte value of 0 on the stack
IL_0002: conv.i8 ; Convert the 4-byte 0 to an 8-byte 0
IL_0003: stfld int64 WordCounter::totalLines

位於 IL_0000 的指令會將傳遞至方法的第一個參數載入到虛擬堆疊上,而且一定會將物件記憶體的位址傳遞給每一個執行個體方法 (Instance Method)。這個引數稱為 Argument Zero,而且不會明確顯示在方法的簽名碼中。因此,即使 .ctor 方法看起來像是接收了零個引數,實際上是接收了一個引數。接著,位於 IL_0000 的指令會將這個物件的指標載入到虛擬堆疊上。

位於 IL_0001 的指令會將 4 位元組的零值常數載入到虛擬堆疊上。

位於 IL_0002 的指令會取得堆疊頂端的數值 (4 位元組的零),並將它轉換成 8 位元組的零,如此便會將 8 位元組的零放到堆疊的頂端。

這時,堆疊含有兩個運算元:8 位元組的零和指向這個物件的指標。位於 IL_0003 的指令會使用這兩個運算元,將堆疊頂端的數值 (8 位元組的零) 儲存到堆疊上所辨識物件的 totalLines 欄位中。

totalCharstotalBytestotalWords 欄位會重複相同的 MSIL 指令序列 (Sequence)。

wordCounter 欄位的初始化是從位於 IL_0020 的指令開始,如以下所示:

IL_0020: ldarg.0
IL_0021: newobj instance void [mscorlib]System.Collections.SortedList::.ctor()
IL_0026: stfld class [mscorlib]System.Collections.SortedList WordCounter::wordCounter

位於 IL_0020 的指令會將 WordCounterthis 指標推入虛擬堆疊上。newobj 指令不會使用這個運算元,但是位於 IL_0026 的 stfld 指令將會使用。

位於 IL_0021 的指令會告知 Runtime 建立新的 System.Collections.SortedList 物件,並且不使用任何引數呼叫它的建構函式。當 newobj 傳回時,SortedList 物件的位址是在堆疊上。這時候,位於 IL_0026 的 stfld 指令會將 SortedList 物件的指標儲存到 WordCounter 物件的 wordCounter 欄位中。

在所有 WordCounter 物件的欄位都完成初始化之後,位於 IL_002b 的指令會將 this 指標推到虛擬堆疊上,然後 IL_002b 會呼叫基底型別 (Base Type) (System.Object) 中的建構函式。

當然,位於 IL_0031 的最後一個指令是傳回指令,會使 WordCounter 建構函式傳回到建立函式的程式碼中。建構函式必須傳回 void,在建構函式傳回之前才不會將任何物件放入堆疊上。

下面是另外一個範例。請按兩下 GetWordsByOccurranceEnumerator 方法,即可看見它的 MSIL 程式碼,如下圖所示。

您可以看見,這個方法的程式碼大小為 69 個位元組,而且這個方法在虛擬堆疊上需要有四個位置。此外,這個方法還有三個區域變數:一個為 System.Collection.SortedList 型別,另外兩個為 System.Collections.IDictionaryEnumerator 型別。請注意,除非組件與 /debug 選項相容,否則不會將原始程式碼中提到的變數名稱發出到 MSIL 程式碼中。如果沒有使用 /debug,會分別使用 V_0V_1V_2 等變數名稱來取代 sldeCS$00000003$00000000

當這個方法開始執行時,第一件事就是執行 newobj 指令,這個指令會建立新的 System.Collections.SortedList 物件,並呼叫這個物件的預設建構函式。當 newobj 傳回時,所建立物件的位址是在虛擬堆疊上。stloc.0 指令 (位於 IL_0005) 會將這個值儲存在區域變數 0 或 sl (不含 /debug 的 V_0) (屬於 System.Collections.SortedList 型別) 中。

位於 IL_0006 和 IL_0007 的指令會將 WordCounter 物件的 this 指標 (在傳遞至方法的 Argument Zero 中) 載入到堆疊上,並呼叫 GetWordsAlphabeticallyEnumerator 方法。當 call 指令傳回時,列舉值的位址是在堆疊上。stloc.1 指令 (位於 IL_000c) 會將這個位址儲存在區域變數 1 或 de (不含 /debug 的 V_1),這個變數屬於 System.Collections.IDictionaryEnumerator 型別。

位於 IL_000d 的 br.s 指令會造成 while 陳述式的 IL 測試條件無條件分支。這個 IL 測試條件從位於 IL_0032 的指令開始。在 IL_0032 位址中,會將 de (或 V_1) (IDictionaryEnumerator) 的位址推到堆疊上,然後在 IL_0033 位址呼叫它的 MoveNext 方法。如果 MoveNext 傳回 True,表示有要列舉的項目,而且 brtrue.s 指令會跳到位於 IL_000f 的指令。

在位於 IL_000f 和 IL_0010 的指令中,會將 sl (或 V_0)de (或 V_1) 中的物件位址推到堆疊上。然後,呼叫 IdictionaryEnumerator 物件的 get_Value 屬性方法,以取得目前項目的項目數目。這個數目是儲存在 System.Int32 中的 32 位元值。程式碼會將 Int32 物件轉換成 int 數值型別 (Value Type)。將參考型別 (Reference Type) 轉換成數值型別需要位於 IL_0016 的 unbox 指令。當 unbox 傳回時,Unboxed 數值的位址是在堆疊上。ldind.i4 指令 (位於 IL_001b) 會將 4 位元組的數值 (這個數值會指向目前在堆疊上的位址) 載入到堆疊上。換句話說,Unboxed 4 位元組整數是放在堆疊上。

在位於 IL_001c 的指令中,會將 sl (或 V_1) 的數值 (IDictionaryEnumerator 的位址) 推到堆疊上,並呼叫它的 get_Key 屬性方法。當 get_Key 傳回時,System.Object 的位址是在堆疊上。程式碼知道字典中包含字串,因此編譯器會使用位於 IL_0022 的 castclass 指令,將這個 Object 轉換成 String

以下幾個新的指令 (從 IL_0027 到 IL_002d) 會建立新的 WordOccurrence 物件,然後將物件的位址傳遞至 SortedLists 物件的 Add 方法。

在位於 IL_0032 的指令中,會再評估一次 while 陳述式的測試條件。如果 MoveNext 傳回 True,迴圈 (Loop) 會執行另一個循環。但是,如果 MoveNext 傳回 False,迴圈會停止執行,並在位於 IL_003a 的指令結束。位於 IL_003a 到 IL_0040 的指令會呼叫 SortLists 物件的 GetEnumerator 方法。傳回的值為 System.Collections.IDictionaryEnumerator,它是被留在堆疊上而成為 GetWordsByOccurrenceEnumerator 傳回值。