Cet article a fait l’objet d’une traduction automatique. Pour afficher l’article en anglais, activez la case d’option Anglais. Vous pouvez également afficher le texte anglais dans une fenêtre contextuelle en faisant glisser le pointeur de la souris sur le texte traduit.
Traduction
Anglais

NormalizationForm énumération

 

Date de publication : novembre 2016

Définit le type de normalisation à effectuer.

Espace de noms:   System.Text
Assembly:  mscorlib (dans mscorlib.dll)

[ComVisibleAttribute(true)]
public enum NormalizationForm

Nom du membreDescription
FormC

Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition canonique complète, suivie du remplacement des séquences par leurs composites principaux, si possible.

FormD

Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition canonique complète.

FormKC

Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition de compatibilité complète, suivie du remplacement des séquences par leurs composites principaux, si possible.

FormKD

Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition de compatibilité complète.

Certaines séquences Unicode sont considérées comme équivalentes, car elles représentent le même caractère. Par exemple, les éléments suivants sont considérées comme équivalentes, car ces peuvent être utilisé pour représenter « ắ » :

  • « \u1EAF »

  • « \u0103\u0301 »

  • « \u0061\u0306\u0301 »

Toutefois, ordinal, autrement dit, les comparaisons binaires, considèrent ces séquences identiques car ils contiennent des valeurs de code Unicode différentes. Avant d’effectuer des comparaisons ordinales, les applications doivent normaliser ces chaînes afin de les décomposer en leurs composants de base.

Chaque caractère Unicode composite est mappé à une séquence plus simple d’un ou plusieurs caractères. Le processus de décomposition remplace chaque caractère composite d’une chaîne avec ses mappages élémentaires. De manière récursive une décomposition complète effectue ce remplacement jusqu'à ce qu’aucun des caractères de la chaîne peut être décomposé plus avant.

La norme Unicode définit deux types de décomposition : la décomposition de compatibilité et la décomposition canonique. Dans la décomposition de compatibilité, la mise en forme peut-être être perdue. Dans la décomposition canonique, qui est un sous-ensemble de la décomposition de compatibilité, la mise en forme est conservé.

Sont considérées comme deux jeux de caractères présentent une équivalence canonique si leurs décompositions canoniques complètes sont identiques. De même, deux jeux de caractères sont considérés comme ayant l’équivalence de compatibilité si leur décomposition de compatibilité complète est identiques.

Pour plus d’informations sur la normalisation, l’équivalence et décomposition, consultez Unicode Standard Annex #15: Unicode Normalization Forms à l’adresse unicode.org.

Plateforme Windows universelle
Disponible depuis 10
.NET Framework
Disponible depuis 2.0
Retour au début
Afficher: