Unicode no .NET estrutura

Artigo
08/25/2010

O .NET estrutura usa Unicode UTF-16 (Unicode transformação Format, formato de codificação de 16 bit) para representar caracteres.Em alguns casos, o .NET estrutura usa UTF-8 internamente.

O padrão Unicode é o esquema de codificação de caracteres universais para caractere e texto.Ele atribui um valor numérico exclusivo, chamado um ponto de código e um nome para cada caractere usado nos idiomas escritos do mundo.Por exemplo, o caractere "A" é representado por ponto de código "U + 0041" e o nome "Latina LETTER maiúsculas A".Valores estão disponível para mais de 65.000 caracteres e houver espaço para oferecer suporte a até um milhão mais.Para obter mais informações, consulte The Unicode Standard no residência do Unicode.

No passado, os diversos requisitos de linguagem para diferentes culturas forçado aplicativos usem codificações diferentes para representar dados internamente.Esses diversas esquemas de codificação forçou sistema autônomo desenvolvedores criem bases de código fragmentado para sistemas operacionais e aplicativos, tais sistema autônomo edições de byte único para idiomas europeus, edições de dois bytes para idiomas asiáticos e edições com suporte bidirecional para idiomas do Oriente Médio.Essa fragmentação tornou difíceis de compartilhar dados entre culturas e ainda mais difíceis de desenvolver aplicativos preparados para o mundo que oferecem suporte a uma interface do usuário multilíngüe.

O esquema de codificação de dados Unicode simplifica mundo aplicativo desenvolvimento porque ela permite que todos os caracteres internacionais ser representado em uma única codificação.Os desenvolvedores de aplicativos não precisam mais manter controle sobre o esquema de codificação usada para produzir caracteres para um linguagem específico, e dados podem ser compartilhados entre sistemas internacionalmente sem corrompido.

Unicode no .NET estrutura

Consulte também

Conceitos

Outros recursos

Recursos adicionais