Unicode dans le .NET Framework

Mise à jour : novembre 2007

Le .NET Framework utilise le codage Unicode 16 bits UTF-16 (Unicode Transformation Format) pour représenter les caractères. Dans certains cas, le .NET Framework utilise le codage UTF-8 en interne.

La norme Unicode est le schéma de codage universel pour les caractères et le texte. Cette norme assigne une valeur numérique unique, appelée point de code, et un nom à chaque caractère utilisé dans les langues écrites du monde. Par exemple, le caractère « A » est représenté par le point de code « U+0041 » et le nom « LATIN CAPITAL LETTER A ». Il existe déjà des valeurs Unicode pour plus de 65 000 caractères, et ce système de codage est en mesure d'en prendre en charge jusqu'à un million de plus. Pour plus d'informations, consultez la norme Unicode sur la page d'accueil Unicode

Dans le passé, la diversité des contraintes linguistiques des différentes cultures obligeait les applications à utiliser plusieurs systèmes de codage pour représenter les données en interne. Ces divers systèmes de codage forçaient les développeurs à créer des bases de code fragmentées pour les systèmes d'exploitation et les applications, par exemple les éditions codées sur un octet pour les langues européennes, les éditions codées sur deux octets pour les langues asiatiques et les éditions bidirectionnelles pour les langues du Moyen-Orient. Cette fragmentation a rendu difficile le partage des données entre les cultures et encore plus difficile le développement d'applications mondialisables prenant en charge une interface utilisateur multilingue.

Le schéma de codage de données Unicode simplifie le développement d'applications mondialisables dans la mesure où il permet de représenter tous les caractères internationaux dans un seul système de codage. Il n'est plus nécessaire que les développeurs d'applications conservent une trace du schéma de codage utilisé pour produire des caractères pour une langue spécifique, et les données peuvent être partagées entre les systèmes à une échelle internationale sans risque d'endommagement.

Voir aussi

Concepts

Codage des types de base

Autres ressources

Codage et localisation