Prise en charge Unicode pour les paires de substitution et les séquences de caractères d'association

[Cette documentation constitue un aperçu et pourra faire l'objet de modifications dans les versions ultérieures. Des rubriques vierges sont incluses en tant qu'espaces réservés.]

La norme Unicode définit une paire de substitution comme représentation de caractère codée pour un seul caractère abstrait, consistant en une suite de deux unités de code. La première valeur de la paire de substitution est le substitut étendu, et contient une valeur de code 16 bits comprise dans l'intervalle de U+D800 à U+DBFF. La seconde valeur de la paire est le substitut faible, dont les valeurs de code sont comprises entre U+DC00 et U+DFFF.

La norme Unicode définit une séquence de caractères d'association comme combinaison d'un caractère de base et d'un ou plusieurs caractères d'association. Une paire de substitution peut représenter un caractère de base ou un caractère d'association. Pour plus d'informations sur les paires de substitution et la combinaison de séquences de caractères, consultez la norme Unicode sur la page d'accueil Unicode

Le point clé à se souvenir est que les paires de substitution représentent des caractères uniques 32 bits. Vous ne pouvez pas supposer qu'une valeur d'encodage Unicode 16 bits mappe exactement un caractère. En utilisant les paires de substitution, un système d'encodage Unicode 16 bits peut définir un million de points de code supplémentaires auxquels des caractères seront assignés par la norme Unicode.

Le .NET Framework prend en charge les éléments de texte. Un élément de texte est une unité de texte qui est affichée sous la forme d'un seul caractère, appelé graphème. Un élément de texte peut être un caractère de base, une paire de substitution ou une séquence de caractères d'association. La classe StringInfo fournit des méthodes qui permettent à votre application de décomposer une chaîne en ses éléments de texte et d'itérer au sein de ces éléments de texte. Pour obtenir un exemple d'utilisation de la classe StringInfo, consultez Indexation de chaîne.

Voir aussi

Concepts

Indexation de chaîne