Surrogate 字組和結合字元序列的 Unicode 支援

Unicode Standard 將 Surrogate 字組定義為單一抽象字元 (由兩個字碼單位組成) 的編碼字元表示。 Surrogate 字組的第一個值為高 Surrogate,這是範圍從 U+D800 到 U+DBFF 的 16 位元字碼值。 字組的第二個值為低 Surrogate,範圍在 U+DC00 到 U+DFFF。

Unicode Standard 將結合字元序列定義為基底字元和一個或多個結合字元的組合。 Surrogate 字組可以表示基底字元或組合字元 如需 Surrogate 字組及合併字串序列的詳細資訊,請參閱以下網頁中的 Unicode 標準:Unicode 首頁

請注意,Surrogate 字組表示 32 位元的單一字元。 您無法假設某個 16 位元的 Unicode 編碼值會對應到某個字元。 使用 Surrogate 字組時,16 位元的 Unicode 編碼系統可提供額外的一百萬個字碼指標,Unicode 標準可指派字元給這些指標。

.NET Framework 支援文字項目。 文字項目是顯示為單一字元的文字單位,又稱為字母。 文字項目可以是基底字元、Surrogate 字組或組合字元序列。 StringInfo 類別提供讓您的應用程式將字元分隔為文字項目以及逐一查看文字項目的方法。 如需使用 StringInfo 類別的範例,請參閱字串索引

請參閱

概念

.NET Framework 中的 Unicode

字串索引