Данная статья переведена с помощью средств машинного перевода. Чтобы просмотреть ее на английском языке, установите флажок Английский. Вы также можете просматривать английский текст во всплывающем окне, наводя указатель мыши на переведенный текст.
Перевод
Английский

Перечисление NormalizationForm

 

Опубликовано: Октябрь 2016

Определяет тип выполняемой нормализации.

Пространство имен:   System.Text
Сборка:  mscorlib (в mscorlib.dll)

[ComVisibleAttribute(true)]
public enum NormalizationForm

Имя элементаОписание
FormC

Указывает, что строка Юникода нормализуется с использованием полной канонической декомпозиции, следуют замена последовательностей их первичными составляющими, если это возможно.

FormD

Указывает, что строка Юникода нормализуется с использованием полной канонической декомпозиции.

FormKC

Указывает, что строка Юникода нормализуется с использованием полной декомпозиции совместимости, следуют замена последовательностей их первичными составляющими, если это возможно.

FormKD

Указывает, что строка Юникода нормализуется с использованием полной декомпозиции совместимости.

Некоторые последовательности Юникода считаются эквивалентными, поскольку они представляют тот же символ. Например ниже считаются эквивалентными, так как любой из них может использоваться для представления символа «ắ»:

  • «\u1EAF»

  • «\u0103\u0301»

  • «\u0061\u0306\u0301»

Тем не менее порядковый номер, т. е. двоичных, сравнениях рассмотрим эти последовательности другой, так как они содержат различные кодовые значения Юникода. Перед выполнением порядковых сравнений в приложениях следует нормализовать эти строки, чтобы разбить их на базовые компоненты.

Каждый составной символ Юникода сопоставляется с базовой последовательностью из одного или нескольких символов. В процессе декомпозиции составные символы в строке заменяются их базовыми соответствиями. Такая замена выполняется рекурсивно полной декомпозиции, пока ни один из символов в строке может быть разделен Далее.

Юникод определяет два типа декомпозиции: декомпозиция совместимости и каноническая декомпозиция. При декомпозиции совместимости могут быть утеряны сведения о форматировании. В канонической декомпозиции, которая является подмножеством декомпозиции совместимости, сведения о форматировании сохраняются.

Два набора символов считаются канонически если их полные канонические декомпозиции идентичны. Аналогичным образом два набора символов считаются эквивалентными по совместимости, если идентичны их полные декомпозиции совместимости.

Дополнительные сведения о нормализации, декомпозиции и эквивалентности см. в разделе Unicode Standard Annex #15: Unicode Normalization Forms кодовые.

Универсальная платформа Windows
Доступно с 10
.NET Framework
Доступно с 2.0
Вернуться в начало
Показ: