Actualización: noviembre 2007
Representa una codificación UTF-16 de caracteres Unicode.
Espacio de nombres:
System.Text
Ensamblado:
mscorlib (en mscorlib.dll)
Visual Basic (Declaración)
<SerializableAttribute> _
<ComVisibleAttribute(True)> _
Public Class UnicodeEncoding _
Inherits Encoding
Dim instance As UnicodeEncoding
[SerializableAttribute]
[ComVisibleAttribute(true)]
public class UnicodeEncoding : Encoding
[SerializableAttribute]
[ComVisibleAttribute(true)]
public ref class UnicodeEncoding : public Encoding
/** @attribute SerializableAttribute */
/** @attribute ComVisibleAttribute(true) */
public class UnicodeEncoding extends Encoding
public class UnicodeEncoding extends Encoding
Codificar es el proceso de transformar un conjunto de caracteres Unicode en una secuencia de bytes. La descodificación es el proceso de transformar una secuencia de bytes codificados en un conjunto de caracteres Unicode.
El estándar Unicode asigna un punto de código (un número) a cada carácter en todas las secuencias de comandos compatibles. Un Formato de transformación Unicode (UTF) es un método para codificar ese punto de código. El estándar Unicode usa los UFT siguientes:
UTF-8, que representa cada punto de código como una secuencia de uno a cuatro bytes.
UTF-16, que representa cada punto de código como una secuencia de uno a dos enteros de 16 bits.
UTF-32, que representa cada punto de código como un entero de 32 bits.
Nota: |
|---|
La codificación UTF-7 admite ciertos protocolos para los que es necesario, normalmente los protocolos de correo electrónico o de grupos de noticias. Como UTF-7 no es especialmente seguro o robusto, generalmente no se debe usar. UTF-8 se debe preferir normalmente a UTF-7. |
Para obtener más información sobre UFT y otras codificaciones que System.Text admite, vea Introducción a las codificaciones y Utilizar codificación Unicode.
El método GetByteCount determina cuántos bytes resultan de codificar un conjunto de caracteres Unicode, y el método GetBytes realiza la codificación real.
Igualmente, el método GetCharCount determina el número de caracteres resultante en la descodificación de una secuencia de bytes, y los métodos GetChars y GetString realizan la descodificación real.
UnicodeEncoding corresponde a las páginas de código de Windows 1200 (orden de bytes little-endian) y 1201 (orden de bytes big-endian).
El codificador puede usar el orden de bytes big-endian (primero el byte más significativo) o el orden de bytes little-endian (primero el byte menos significativo). Por ejemplo, la letra mayúscula latina A (punto de código U+0041) se serializa del siguiente modo (en hexadecimal):
Generalmente es más eficaz almacenar caracteres Unicode utilizando el orden de bytes nativo. Por ejemplo, es mejor usar el orden de bytes little-endian en plataformas little-endian, como los equipos Intel.
Opcionalmente, la clase UnicodeEncoding proporciona un preámbulo que es una matriz de bytes que se puede anteponer a la secuencia de bytes resultante del proceso de codificación. Si el preámbulo contiene una marca de orden de bytes (BOM), ayudará al descodificador a determinar el orden de bytes y el formato de la transformación o UTF. El método GetPreamble recupera una matriz de bytes que pueden incluir BOM. Para obtener más información sobre el orden de bytes y la marca de orden de bytes, vea The Unicode Standard en Unicode home page
Nota: |
|---|
Para habilitar la detección de errores y hacer que la instancia de clase sea más segura, debe usar en la aplicación el constructor UnicodeEncoding que toma un parámetro throwOnInvalidBytes y establecer ese parámetro en true. Con la detección de errores, un método que detecte una secuencia de caracteres o de bytes no válida produce una excepción ArgumentException. Sin la detección de errores, no se producirá excepción alguna y, por lo general, se omitirá la secuencia no válida. |
En el ejemplo siguiente se muestra cómo codificar una cadena de caracteres Unicode en una matriz de bytes mediante UnicodeEncoding. La matriz de bytes se descodifica y se convierte en cadena para demostrar que no se pierden datos.
Imports System
Imports System.Text
Imports Microsoft.VisualBasic.Strings
Class UnicodeEncodingExample
Public Shared Sub Main()
' The encoding.
Dim uni As New UnicodeEncoding()
' Create a string that contains Unicode characters.
Dim unicodeString As String = _
"This Unicode string contains two characters " & _
"with codes outside the traditional ASCII code range, " & _
"Pi (" & ChrW(928) & ") and Sigma (" & ChrW(931) & ")."
Console.WriteLine("Original string:")
Console.WriteLine(unicodeString)
' Encode the string.
Dim encodedBytes As Byte() = uni.GetBytes(unicodeString)
Console.WriteLine()
Console.WriteLine("Encoded bytes:")
Dim b As Byte
For Each b In encodedBytes
Console.Write("[{0}]", b)
Next b
Console.WriteLine()
' Decode bytes back to string.
' Notice Pi and Sigma characters are still present.
Dim decodedString As String = uni.GetString(encodedBytes)
Console.WriteLine()
Console.WriteLine("Decoded bytes:")
Console.WriteLine(decodedString)
End Sub
End Class
using System;
using System.Text;
class UnicodeEncodingExample {
public static void Main() {
// The encoding.
UnicodeEncoding unicode = new UnicodeEncoding();
// Create a string that contains Unicode characters.
String unicodeString =
"This Unicode string contains two characters " +
"with codes outside the traditional ASCII code range, " +
"Pi (\u03a0) and Sigma (\u03a3).";
Console.WriteLine("Original string:");
Console.WriteLine(unicodeString);
// Encode the string.
Byte[] encodedBytes = unicode.GetBytes(unicodeString);
Console.WriteLine();
Console.WriteLine("Encoded bytes:");
foreach (Byte b in encodedBytes) {
Console.Write("[{0}]", b);
}
Console.WriteLine();
// Decode bytes back to string.
// Notice Pi and Sigma characters are still present.
String decodedString = unicode.GetString(encodedBytes);
Console.WriteLine();
Console.WriteLine("Decoded bytes:");
Console.WriteLine(decodedString);
}
}
using namespace System;
using namespace System::Text;
using namespace System::Collections;
int main()
{
// The encoding.
UnicodeEncoding^ unicode = gcnew UnicodeEncoding;
// Create a String* that contains Unicode characters.
String^ unicodeString = L"This Unicode string contains two characters with codes outside the traditional ASCII code range, Pi (\u03a0) and Sigma (\u03a3).";
Console::WriteLine( "Original string:" );
Console::WriteLine( unicodeString );
// Encode the String*.
array<Byte>^encodedBytes = unicode->GetBytes( unicodeString );
Console::WriteLine();
Console::WriteLine( "Encoded bytes:" );
IEnumerator^ myEnum = encodedBytes->GetEnumerator();
while ( myEnum->MoveNext() )
{
Byte b = safe_cast<Byte>(myEnum->Current);
Console::Write( "[{0}]", b );
}
Console::WriteLine();
// Decode bytes back to String*.
// Notice Pi and Sigma characters are still present.
String^ decodedString = unicode->GetString( encodedBytes );
Console::WriteLine();
Console::WriteLine( "Decoded bytes:" );
Console::WriteLine( decodedString );
}
import System.*;
import System.Text.*;
class UnicodeEncodingExample
{
public static void main(String[] args)
{
// The encoding.
UnicodeEncoding unicode = new UnicodeEncoding();
// Create a string that contains Unicode characters.
String unicodeString = "This Unicode string contains two characters "
+ "with codes outside the traditional ASCII code range, "
+ "Pi (\u03a0) and Sigma (\u03a3).";
Console.WriteLine("Original string:");
Console.WriteLine(unicodeString);
// Encode the string.
ubyte encodedBytes[] = unicode.GetBytes(unicodeString);
Console.WriteLine();
Console.WriteLine("Encoded bytes:");
for(int iCtr = 0; iCtr < encodedBytes.length; iCtr++) {
ubyte b = encodedBytes[iCtr];
Console.Write("[{0}]", String.valueOf(b));
}
Console.WriteLine();
// Decode bytes back to string.
// Notice Pi and Sigma characters are still present.
String decodedString = unicode.GetString(encodedBytes);
Console.WriteLine();
Console.WriteLine("Decoded bytes:");
Console.WriteLine(decodedString);
} //main
} //UnicodeEncodingExample
System..::.Object
System.Text..::.Encoding
System.Text..::.UnicodeEncoding
Seguridad para subprocesos
Todos los miembros static (Shared en Visual Basic) públicos de este tipo son seguros para la ejecución de subprocesos. No se garantiza que los miembros de instancias sean seguros para la ejecución de subprocesos.
Windows Vista, Windows XP SP2, Windows XP Media Center Edition, Windows XP Professional x64 Edition, Windows XP Starter Edition, Windows Server 2003, Windows Server 2000 SP4, Windows Millennium Edition, Windows 98, Windows CE, Windows Mobile para Smartphone, Windows Mobile para Pocket PC, Xbox 360
.NET Framework y .NET Compact Framework no admiten todas las versiones de cada plataforma. Para obtener una lista de las versiones compatibles, vea Requisitos de sistema de .NET Framework.
.NET Framework
Compatible con: 3.5, 3.0, 2.0, 1.1, 1.0
.NET Compact Framework
Compatible con: 3.5, 2.0, 1.0
XNA Framework
Compatible con: 2.0, 1.0
Referencia
Otros recursos