Este artículo se tradujo automáticamente. Para ver el artículo en inglés, active la casilla Inglés. Además, puede mostrar el texto en inglés en una ventana emergente si mueve el puntero del mouse sobre el texto.
Traducción
Inglés

Enumeración NormalizationForm

 

Publicado: octubre de 2016

Define el tipo de normalización a realizar.

Espacio de nombres:   System.Text
Ensamblado:  mscorlib (en mscorlib.dll)

[ComVisibleAttribute(true)]
public enum NormalizationForm

Nombre de miembroDescripción
FormC

Indica que una cadena Unicode se normalizarán mediante descomposición canónica completa, seguida por el reemplazo de secuencias por sus compuestos primarios, si es posible.

FormD

Indica que una cadena Unicode se normalizarán mediante descomposición canónica completa.

FormKC

Indica que una cadena Unicode se normalizarán mediante descomposición de compatibilidad completa, seguida por el reemplazo de secuencias por sus compuestos primarios, si es posible.

FormKD

Indica que una cadena Unicode se normalizarán mediante descomposición de compatibilidad completa.

Algunas secuencias de Unicode se consideran equivalentes porque representan el mismo carácter. Por ejemplo, los siguientes se consideran equivalentes porque se puede usar cualquiera de estos representan "ắ":

  • "\u1EAF"

  • "\u0103\u0301"

  • "\u0061\u0306\u0301"

Sin embargo, ordinal, es decir, las comparaciones binarias, consideran estas secuencias diferentes, ya que contienen valores de código Unicode distintos. Antes de realizar comparaciones ordinales, las aplicaciones deben normalizar estas cadenas para descomponerlas en sus componentes básicos.

Cada carácter Unicode compuesto se asigna a una secuencia más básica de uno o más caracteres. El proceso de descomposición reemplaza los caracteres compuestos en una cadena por sus asignaciones más básicas. Una de forma recursiva la descomposición completa realiza este reemplazo hasta que ninguno de los caracteres de la cadena se puede descomponer aún más.

Unicode define dos tipos de descomposición: descomposición de compatibilidad y la canónica. En la descomposición de compatibilidad, puede haberse perdido información de formato. En la descomposición canónica, que es un subconjunto de compatibilidad, se conserva la información de formato.

Se consideran dos conjuntos de caracteres tienen equivalencia canónica cuando sus descomposiciones canónicas completas sean idénticas. Del mismo modo, se consideran dos conjuntos de caracteres tendrán equivalencia de compatibilidad cuando sus descomposiciones de compatibilidad completa sean idénticos.

Para obtener más información sobre la normalización, descomposiciones y equivalencia, vea Unicode Standard Annex #15: Unicode Normalization Forms en unicode.org.

Plataforma universal de Windows
Disponible desde 10
.NET Framework
Disponible desde 2.0
Volver al principio
Mostrar: