Windows-Apps
Inhaltsverzeichnis reduzieren
Inhaltsverzeichnis erweitern
Informationen
Das angeforderte Thema wird unten angezeigt. Es ist jedoch nicht in dieser Bibliothek vorhanden.

Encoding-Klasse

 

Stellt eine Zeichencodierung dar.

Um den .NET Framework-Quellcode für diesen Typ zu durchsuchen, rufen Sie die Verweisquelle auf.

Namespace:   System.Text
Assembly:  mscorlib (in mscorlib.dll)


[SerializableAttribute]
[ComVisibleAttribute(true)]
public abstract class Encoding : ICloneable

NameBeschreibung
System_CAPS_protmethodEncoding()

Initialisiert eine neue Instanz der Encoding-Klasse.

System_CAPS_protmethodEncoding(Int32)

Initialisiert eine neue Instanz der Encoding-Klasse, die der angegebenen Codepage entspricht.

System_CAPS_protmethodEncoding(Int32, EncoderFallback, DecoderFallback)

Initialisiert eine neue Instanz der Encoding-Klasse, die der angegebenen Codepage entspricht, mit den angegebenen Fallbackstrategien für Codierer und Decodierer.

NameBeschreibung
System_CAPS_pubpropertySystem_CAPS_staticASCII

Ruft eine Codierung für den ASCII-Zeichensatz (7-Bit) ab.

System_CAPS_pubpropertySystem_CAPS_staticBigEndianUnicode

Ruft eine Codierung für das UTF-16-Format mit Big-Endian-Bytereihenfolge ab.

System_CAPS_pubpropertyBodyName

Beim Überschreiben in einer abgeleiteten Klasse wird ein Name für die aktuelle Codierung abgerufen, die mit den Body-Tags des E-Mail-Agenten verwendet werden kann.

System_CAPS_pubpropertyCodePage

Ruft den Codepagebezeichner der aktuellen Encoding-Klasse beim Überschreiben in einer abgeleiteten Klasse ab.

System_CAPS_pubpropertyDecoderFallback

Ruft das DecoderFallback-Objekt für das aktuelle Encoding-Objekt ab.

System_CAPS_pubpropertySystem_CAPS_staticDefault

Ruft eine Codierung für die aktuelle ANSI-Codepage des Betriebssystems ab.

System_CAPS_pubpropertyEncoderFallback

Ruft das EncoderFallback-Objekt für das aktuelle Encoding-Objekt ab.

System_CAPS_pubpropertyEncodingName

Beim Überschreiben in einer abgeleiteten Klasse wird die Klartextbeschreibung der aktuellen Codierung abgerufen.

System_CAPS_pubpropertyHeaderName

Beim Überschreiben in einer abgeleiteten Klasse wird ein Name für die aktuelle Codierung abgerufen, die mit den Header-Tags des E-Mail-Agenten verwendet werden kann.

System_CAPS_pubpropertyIsBrowserDisplay

Beim Überschreiben in einer abgeleiteten Klasse wird ein Wert abgerufen, der angibt, ob die aktuelle Codierung von Browserclients zum Anzeigen des Inhalts verwendet werden kann.

System_CAPS_pubpropertyIsBrowserSave

Beim Überschreiben in einer abgeleiteten Klasse wird ein Wert abgerufen, der angibt, ob die aktuelle Codierung von Browserclients zum Speichern von Inhalt verwendet werden kann.

System_CAPS_pubpropertyIsMailNewsDisplay

Beim Überschreiben in einer abgeleiteten Klasse wird ein Wert abgerufen, der angibt, ob die aktuelle Codierung von Mail- und Newsclients zum Anzeigen von Inhalt verwendet werden kann.

System_CAPS_pubpropertyIsMailNewsSave

Beim Überschreiben in einer abgeleiteten Klasse wird ein Wert abgerufen, der angibt, ob die aktuelle Codierung von Mail- und Newsclients zum Speichern von Inhalt verwendet werden kann.

System_CAPS_pubpropertyIsReadOnly

Ruft beim Überschreiben in einer abgeleiteten Klasse einen Wert ab, der angibt, ob die aktuelle Codierung schreibgeschützt ist.

System_CAPS_pubpropertyIsSingleByte

Ruft beim Überschreiben in einer abgeleiteten Klasse einen Wert ab, der angibt, ob die aktuelle Codierung Einzelbyte-Codepunkte verwendet.

System_CAPS_pubpropertySystem_CAPS_staticUnicode

Ruft eine Codierung für das UTF-16-Format in der Little-Endian-Bytereihenfolge ab.

System_CAPS_pubpropertySystem_CAPS_staticUTF32

Ruft eine Codierung für das UTF-32-Format in der Little-Endian-Bytereihenfolge ab.

System_CAPS_pubpropertySystem_CAPS_staticUTF7

Ruft eine Codierung für das UTF-7-Format ab.

System_CAPS_pubpropertySystem_CAPS_staticUTF8

Ruft eine Codierung für das UTF-8-Format ab.

System_CAPS_pubpropertyWebName

Beim Überschreiben in einer abgeleiteten Klasse wird der Name für die aktuelle Codierung bei der Internet Assigned Numbers Authority (IANA) registriert.

System_CAPS_pubpropertyWindowsCodePage

Beim Überschreiben in einer abgeleiteten Klasse wird die Codepage des Betriebssystems Windows abgerufen, die der aktuellen Codierung am ehesten entspricht.

NameBeschreibung
System_CAPS_pubmethodClone()

Erstellt beim Überschreiben in einer abgeleiteten Klasse eine flache Kopie des aktuellen Encoding-Objekts.

System_CAPS_pubmethodSystem_CAPS_staticConvert(Encoding, Encoding, Byte[])

Konvertiert ein vollständiges Bytearray aus einer Codierung in eine andere.

System_CAPS_pubmethodSystem_CAPS_staticConvert(Encoding, Encoding, Byte[], Int32, Int32)

Konvertiert einen Bereich von Bytes in einem Bytearray aus einer Codierung in eine andere.

System_CAPS_pubmethodEquals(Object)

Bestimmt, ob das angegebene Object und die aktuelle Instanz gleich sind.(Setzt "Object.Equals(Object)" außer Kraft.)

System_CAPS_protmethodFinalize()

Gibt einem Objekt Gelegenheit, Ressourcen freizugeben und andere Bereinigungen durchzuführen, bevor es von der Garbage Collection freigegeben wird. (Geerbt von Object.)

System_CAPS_pubmethodGetByteCount(Char*, Int32)

Berechnet beim Überschreiben in einer abgeleiteten Klasse die Anzahl der Bytes, die beim Codieren der Zeichen ab dem Zeichenzeiger erzeugt werden.

System_CAPS_pubmethodGetByteCount(Char[])

Berechnet beim Überschreiben in einer abgeleiteten Klasse die Anzahl an Bytes, die beim Codieren aller Zeichen im angegebenen Zeichenarray erzeugt werden.

System_CAPS_pubmethodGetByteCount(Char[], Int32, Int32)

Berechnet beim Überschreiben in einer abgeleiteten Klasse die Anzahl an Bytes, die beim Codieren der Zeichen aus dem angegebenen Zeichenarray erzeugt werden.

System_CAPS_pubmethodGetByteCount(String)

Berechnet beim Überschreiben in einer abgeleiteten Klasse die Anzahl der Bytes, die beim Codieren der Zeichen in der angegebenen Zeichenfolge erzeugt werden.

System_CAPS_pubmethodGetBytes(Char*, Int32, Byte*, Int32)

Beim Überschreiben in einer abgeleiteten Klasse werden die Zeichen beginnend am angegebenen Zeichenzeiger in eine Bytefolge codiert, die ab Beginn des angegebenen Bytezeigers gespeichert wird.

System_CAPS_pubmethodGetBytes(Char[])

Beim Überschreiben in einer abgeleiteten Klasse werden alle Zeichen im angegebenen Zeichenarray in eine Bytefolge codiert.

System_CAPS_pubmethodGetBytes(Char[], Int32, Int32)

Beim Überschreiben in einer abgeleiteten Klasse werden die Zeichen im angegebenen Zeichenarray in eine Bytefolge codiert.

System_CAPS_pubmethodGetBytes(Char[], Int32, Int32, Byte[], Int32)

Beim Überschreiben in einer abgeleiteten Klasse werden die Zeichen aus dem angegebenen Zeichenarray in das angegebene Bytearray codiert.

System_CAPS_pubmethodGetBytes(String)

Beim Überschreiben in einer abgeleiteten Klasse werden alle Zeichen in der angegebenen Zeichenfolge in eine Bytefolge codiert.

System_CAPS_pubmethodGetBytes(String, Int32, Int32, Byte[], Int32)

Beim Überschreiben in einer abgeleiteten Klasse werden die Zeichen aus der angegebenen Zeichenfolge in das angegebene Bytearray codiert.

System_CAPS_pubmethodGetCharCount(Byte*, Int32)

Berechnet beim Überschreiben in einer abgeleiteten Klasse die Anzahl der Zeichen, die beim Decodieren einer Bytefolge ab dem angegebenen Bytezeiger erzeugt werden.

System_CAPS_pubmethodGetCharCount(Byte[])

Berechnet beim Überschreiben in einer abgeleiteten Klasse die Anzahl der Zeichen, die beim Decodieren aller Bytes in dem angegebenen Bytearray erzeugt werden.

System_CAPS_pubmethodGetCharCount(Byte[], Int32, Int32)

Berechnet beim Überschreiben in einer abgeleiteten Klasse die Anzahl der Zeichen, die beim Decodieren einer Bytefolge aus dem angegebenen Bytearray erzeugt werden.

System_CAPS_pubmethodGetChars(Byte*, Int32, Char*, Int32)

Beim Überschreiben in einer abgeleiteten Klasse wird eine Bytefolge beginnend am angegebenen Bytezeiger in Zeichen decodiert, die ab Beginn des angegebenen Zeichenzeigers gespeichert werden.

System_CAPS_pubmethodGetChars(Byte[])

Beim Überschreiben in einer abgeleiteten Klasse werden alle Bytes im angegebenen Bytearray in Zeichen decodiert.

System_CAPS_pubmethodGetChars(Byte[], Int32, Int32)

Beim Überschreiben in einer abgeleiteten Klasse wird eine Bytefolge aus dem angegebenen Bytearray in Zeichen decodiert.

System_CAPS_pubmethodGetChars(Byte[], Int32, Int32, Char[], Int32)

Beim Überschreiben in einer abgeleiteten Klasse wird eine Bytefolge aus dem angegebenen Bytearray in das angegebene Zeichenarray decodiert.

System_CAPS_pubmethodGetDecoder()

Beim Überschreiben in einer abgeleiteten Klasse wird ein Decoder abgerufen, der eine codierte Bytefolge in Zeichen konvertiert.

System_CAPS_pubmethodGetEncoder()

Beim Überschreiben in einer abgeleiteten Klasse wird ein Encoder abgerufen, der eine Folge von Unicode-Zeichen in eine codierte Bytefolge konvertiert.

System_CAPS_pubmethodSystem_CAPS_staticGetEncoding(Int32)

Gibt die dem angegebenen Codepagebezeichner zugeordnete Codierung zurück.

System_CAPS_pubmethodSystem_CAPS_staticGetEncoding(Int32, EncoderFallback, DecoderFallback)

Gibt die dem angegebenen Codepagebezeichner zugeordnete Codierung zurück.Parameter geben einen Fehlerhandler für Zeichen an, die nicht codiert werden können, und für Bytefolgen, die nicht decodiert werden können.

System_CAPS_pubmethodSystem_CAPS_staticGetEncoding(String)

Gibt die dem angegebenen Codepagenamen zugeordnete Codierung zurück.

System_CAPS_pubmethodSystem_CAPS_staticGetEncoding(String, EncoderFallback, DecoderFallback)

Gibt die dem angegebenen Codepagenamen zugeordnete Codierung zurück.Parameter geben einen Fehlerhandler für Zeichen an, die nicht codiert werden können, und für Bytefolgen, die nicht decodiert werden können.

System_CAPS_pubmethodSystem_CAPS_staticGetEncodings()

Gibt ein Array zurück, das alle Codierungen enthält.

System_CAPS_pubmethodGetHashCode()

Gibt den Hashcode für die aktuelle Instanz zurück.(Setzt "Object.GetHashCode()" außer Kraft.)

System_CAPS_pubmethodGetMaxByteCount(Int32)

Berechnet beim Überschreiben in einer abgeleiteten Klasse die maximale Anzahl der Bytes, die beim Codieren der angegebenen Anzahl von Zeichen erzeugt werden.

System_CAPS_pubmethodGetMaxCharCount(Int32)

Berechnet beim Überschreiben in einer abgeleiteten Klasse die maximale Anzahl an Zeichen, die beim Decodieren der angegebenen Anzahl von Bytes erzeugt werden.

System_CAPS_pubmethodGetPreamble()

Beim Überschreiben in einer abgeleiteten Klasse wird eine Bytefolge zurückgegeben, die die verwendete Codierung angibt.

System_CAPS_pubmethodGetString(Byte*, Int32)

Beim Überschreiben in einer abgeleiteten Klasse wird eine angegebene Anzahl von Bytes ab einer angegebenen Adresse in eine Zeichenfolge decodiert.

System_CAPS_pubmethodGetString(Byte[])

Beim Überschreiben in einer abgeleiteten Klasse werden alle Bytes im angegebenen Bytearray in eine Zeichenfolge decodiert.

System_CAPS_pubmethodGetString(Byte[], Int32, Int32)

Beim Überschreiben in einer abgeleiteten Klasse wird eine Bytefolge aus dem angegebenen Bytearray in eine Zeichenfolge decodiert.

System_CAPS_pubmethodGetType()

Ruft den Type der aktuellen Instanz ab.(Geerbt von Object.)

System_CAPS_pubmethodIsAlwaysNormalized()

Ruft einen Wert ab, der angibt, ob die aktuelle Codierung immer normalisiert ist. Es wird die Standardnormalisierungsform verwendet.

System_CAPS_pubmethodIsAlwaysNormalized(NormalizationForm)

Beim Überschreiben in einer abgeleiteten Klasse wird ein Wert abgerufen, der angibt, ob die aktuelle Codierung immer normalisiert ist. Hierzu wird die angegebene Normalisierungsform verwendet.

System_CAPS_protmethodMemberwiseClone()

Erstellt eine flache Kopie des aktuellen Object.(Geerbt von Object.)

System_CAPS_pubmethodSystem_CAPS_staticRegisterProvider(EncodingProvider)

Registriert einen Codierungsanbieter.

System_CAPS_pubmethodToString()

Gibt eine Zeichenfolge zurück, die das aktuelle Objekt darstellt.(Geerbt von Object.)

System_CAPS_noteHinweis

Der .NET Framework-Quellcode für dieses Typs finden Sie unter der Referenz.Sie können den Quellcode online Durchsuchen, den Verweis für die Offlineanzeige herunterladen und Schritt für Schritt durch die Quellen (einschließlich der Patches und Updates) während des Debuggens; finden Sie unter Anweisungen.

Beim Kodieren werden Unicode-Zeichen in eine Bytefolge transformiert.Im Gegensatz dazu ist die Decodierung eine codierte Bytefolge in eine Reihe von Unicode-Zeichen transformiert.Informationen zu den Unicode-Transformation UTFs () und anderen von unterstützten Codierungen Encoding, finden Sie unter Codificação de caracteres no .NET Framework.

Beachten Sie, dass Encoding dient zum Verarbeiten von Unicode-Zeichen anstelle von beliebigen Binärdaten, z. B. Bytearrays.Wenn Sie beliebige Binärdaten in Text codiert werden müssen, verwenden Sie ein Protokoll wie Uuencode, die von Methoden, wie z. B. implementiert wird Convert.ToBase64CharArray.

.NET Framework bietet die folgenden Implementierungen der Encoding -Klasse zur Unterstützung der aktuellen Unicode-Codierungen und anderer Codierungen bereit:

  • ASCIIEncodingcodiert Unicode-Zeichen als einzelne 7-Bit-ASCII-Zeichen.Diese Codierung nur unterstützt Zeichenwerte zwischen U + 0000 und U + 007F.Codepage 20127.Auch verfügbar durch die ASCII Eigenschaft.

  • UTF7EncodingUnicode-Zeichen mithilfe der UTF-7-Codierung codiert.Diese Codierung unterstützt alle Unicode-Zeichenwerte.Codepage 65000.Auch verfügbar durch die UTF7 Eigenschaft.

  • UTF8EncodingUnicode-Zeichen mithilfe der UTF-8-Codierung codiert.Diese Codierung unterstützt alle Unicode-Zeichenwerte.Codepage 65001.Auch verfügbar durch die UTF8 Eigenschaft.

  • UnicodeEncodingUnicode-Zeichen mithilfe der UTF-16-Codierung codiert.Sowohl little endian und big-endian-Byte-Aufträge werden unterstützt.Auch verfügbar durch die Unicode Eigenschaft und die BigEndianUnicode Eigenschaft.

  • UTF32EncodingUnicode-Zeichen mithilfe der UTF-32-Codierung codiert.Sowohl little Endian (Codepage 12000) und big-Endian (Codepage 12001) Aufträge werden unterstützt.Auch verfügbar durch die UTF32 Eigenschaft.

Die Encoding Klasse ist hauptsächlich für die Konvertierung zwischen verschiedenen Codierungen und Unicode vorgesehen.Oft ist eine der abgeleiteten Klassen Unicode die richtige Wahl für Ihre app.

Verwenden der GetEncoding -Methode, um andere Codierungen zu erhalten, und rufen Sie die GetEncodings -Methode, um eine Liste aller Codierungen abzurufen.

Die folgende Tabelle enthält die von .NET Framework unterstützten Codierungen.Jeder dieser Codierung Codepagenummer und die Werte der Codierung des aufgeführt EncodingInfo.Name und EncodingInfo.DisplayName Eigenschaften.Ein Sternchen in der letzten Spalte gibt an, dass die Codepage von .NET Framework, unabhängig von der zugrunde liegenden Plattform systemintern unterstützt wird.Beachten Sie, dass die Codepages, deren EncodingInfo.Name Eigenschaft entspricht einem internationalen Standard nicht notwendigerweise vollständig mit diesem Standard entsprechen.

Codepage

Name

Angezeigter Name

.NET Framework-Unterstützung

37

IBM037

IBM EBCDIC (USA-Kanada)

437

IBM437

OEM-Vereinigte Staaten

500

IBM500

IBM EBCDIC (International)

708

ASMO-708

Arabisch (ASMO 708)

720

DOS-720

Arabisch (DOS)

737

ibm737

Griechisch (DOS)

775

ibm775

Baltisch (DOS)

850

ibm850

Westeuropa (DOS)

852

IBM 852

Mitteleuropäisch (DOS)

855

IBM855

OEM-Kyrillisch

857

ibm857

Türkisch (DOS)

858

IBM00858

OEM Multilingual Lateinisch I

860

IBM860

Portugiesisch (DOS)

861

ibm861

Isländisch (DOS)

862

DOS-862

Hebräisch (DOS)

863

IBM863

Französisch (Kanada) (DOS)

864

IBM864

Arabisch (864)

865

IBM865

Nordisch (DOS)

866

cp866

Kyrillisch (DOS)

869

ibm869

Griechisch, Modern (DOS)

870

IBM870

IBM EBCDIC (Multilingual Lateinisch-2)

874

Windows-874

Thailändisch (Windows)

875

cp875

IBM EBCDIC (Griechisch, Modern)

932

Shift-JIS

Japanisch (Shift-JIS)

936

GB2312

Chinesisch vereinfacht (GB2312)

949

KS_C_5601-1987

Koreanisch

950

Big5

Chinesisch traditionell (Big5)

1026

IBM1026

IBM EBCDIC (Türkisch Latein-5)

1047

IBM01047

IBM Lateinisch-1

1140

IBM01140

IBM EBCDIC (USA-Kanada-Europäisch)

1141

IBM01141

IBM EBCDIC (Deutschland-Europäisch)

1142

IBM01142

IBM EBCDIC (Dänemark-Norwegen-Europäisch)

1143

IBM01143

IBM EBCDIC (Finnland-Schweden-Europäisch)

1144

IBM01144

IBM EBCDIC (Italien-Europäisch)

1145

IBM01145

IBM EBCDIC (Spanien-Europäisch)

1146

IBM01146

IBM EBCDIC (Großbritannien-Europäisch)

1147

IBM01147

IBM EBCDIC (Frankreich-Europäisch)

1148

IBM01148

IBM EBCDIC (International-Europäisch)

1149

IBM01149

IBM EBCDIC (Isländisch-Europäisch)

1200

UTF-16

Unicode

1201

unicodeFFFE

Unicode (Big-Endian)

1250

Windows-1250

Mitteleuropäisch (Windows)

1251

Windows-1251

Kyrillisch (Windows)

1252

Windows -1252

Westeuropäisch (Windows)

1253

Windows-1253

Griechisch (Windows)

1254

Windows-1254

Türkisch (Windows)

1255

Windows-1255

Hebräisch (Windows)

1256

Windows-1256

Arabisch (Windows)

1257

Windows-1257

Baltisch (Windows)

1258

Windows-1258

Vietnamesisch (Windows)

1361

Johab

Niederländisch (Standard)

10000

Macintosh

Westeuropäisch (Mac)

10001

X-Mac-Japanisch

Japanisch (Mac)

10002

X-Mac-Chinesisch (traditionell)

Chinesisch traditionell (Mac)

10003

X-Mac-Koreanisch

Koreanisch (Mac)

10004

X-Mac-Arabisch

Arabisch (Mac)

10005

X-Mac-Hebräisch

Hebräisch (Mac)

10006

X-Mac-Griechisch

Griechisch (Mac)

10007

X (Mac-Kyrillisch)

Kyrillisch (Mac)

10008

X-Mac-chinesesimp

Chinesisch vereinfacht (Mac)

10010

X-Mac-Rumänisch

Rumänisch (Mac)

10017

X-Mac-Ukrainisch

Ukrainisch (Mac)

10021

X-Mac-thai

Thailändisch (Mac)

10029

X-Mac-ce

Mitteleuropäisch (Mac)

10079

X-Mac-Isländisch

Isländisch (Mac)

10081

X-Mac-Türkisch

Türkisch (Mac)

10082

X-Mac-Kroatisch

Kroatisch (Mac)

12000

UTF-32

Unicode (UTF-32)

12001

UTF-32BE

Unicode (UTF-32-Big-Endian)

20000

X-Chinesisch-Zertifikatnamen

Chinesisch traditionell (CNS)

20001

X-cp20001

Analyse der Transaktionskosten Taiwan

20002

X-Chinesisch-Eten

Chinesisch traditionell (Eten)

20003

X-cp20003

IBM5550 Taiwan

20004

X-cp20004

Videotext Taiwan

20005

X-cp20005

Wang Taiwan

20105

X-IA5

Westeuropa (IA5)

20106

X-IA5-Deutsch

Deutsch (IA5)

20107

X-IA5-Schwedisch

Schwedisch (IA5)

20108

X-IA5-Norwegisch

Norwegisch (IA5)

20127

us-ascii

US-ASCII-

20261

X-cp20261

T.61

20269

X-cp20269

ISO -6937

20273

IBM273

IBM EBCDIC (Deutschland)

20277

IBM277

IBM EBCDIC (Dänemark-Norwegen)

20278

IBM278

IBM EBCDIC (Finnland-Schweden)

20280

IBM280

IBM EBCDIC (Italien)

20284

IBM284

IBM EBCDIC (Spanien)

20285

IBM285

IBM EBCDIC (GROßBRITANNIEN)

20290

IBM290

IBM EBCDIC (Japanisch Katakana)

20297

IBM297

IBM EBCDIC (Frankreich)

20420

IBM420

IBM EBCDIC (Arabisch)

20423

IBM423

IBM EBCDIC (Griechisch)

20424

IBM424

IBM EBCDIC (Hebräisch)

20833

X-EBCDIC-KoreanExtended

IBM EBCDIC (erweitertes Koreanisch)

20838

IBM Thai

IBM EBCDIC (Thailändisch)

20866

KOI8-r

Kyrillisch (KOI8-R)

20871

IBM871

IBM EBCDIC (Isländisch)

20880

IBM880

IBM EBCDIC (Kyrillisch, Russisch)

20905

IBM905

IBM EBCDIC (Türkisch)

20924

IBM00924

IBM Lateinisch-1

20932

EUC-JP

Japanisch (JIS 0208-1990 und 0212-1990)

20936

X-cp20936

Chinesisch vereinfacht (GB2312-80)

20949

X-cp20949

Koreanisch Wansung

21025

cp1025

IBM EBCDIC (Kyrillisch, Serbisch-Bulgarisch)

21866

KOI8-u

Kyrillisch (KOI8-U)

28591

ISO-8859-1

Westeuropäisch (ISO)

28592

ISO-8859-2

Mitteleuropäisch (ISO)

28593

ISO-8859-3

Lateinisch 3 (ISO)

28594

ISO-8859-4

Baltisch (ISO)

28595

ISO-8859-5

Kyrillisch (ISO)

28596

ISO-8859-6

Arabisch (ISO)

28597

ISO-8859-7

Griechisch (ISO)

28598

ISO-8859-8

Hebräisch (ISO-visuell)

28599

ISO-8859-9

Türkisch (ISO)

28603

ISO-8859-13

Estnisch (ISO)

28605

ISO-8859-15

Lateinisch 9 (ISO)

29001

X-Europa

Europa

38598

ISO-8859-8-i

Hebräisch (ISO-logisch)

50220

ISO-2022-jp

Japanisch (JIS)

50221

csISO2022JP

Japanisch (JIS-1 Byte Kana erlaubt)

50222

ISO-2022-jp

Japanisch (JIS, 1 Byte erlaubt Kana - SO / SI)

50225

ISO-2022-kr

Koreanisch (ISO)

50227

X-cp50227

Chinesisch vereinfacht (ISO-2022)

51932

Euc-jp

Japanisch (EUC)

51936

EUC-CN

Chinesisch vereinfacht (EUC)

51949

EUC-kr

Koreanisch (EUC)

52936

Hz-gb-2312

Chinesisch vereinfacht (HZ)

54936

GB18030

Vereinfachtes Chinesisch (GB18030)

57002

X-Iscii-de

ISCII Devanagari

57003

X Iscii sein

ISCII Bengalisch

57004

X-Iscii-ta

ISCII Tamil

57005

X-Iscii-te

ISCII Telugu

57006

X Iscii als

ISCII Assamisch

57007

X-Iscii oder

ISCII Oriya

57008

X-Iscii-ka

ISCII Kannada

57009

X-Iscii-ma

ISCII Malayalam

57010

X-Iscii-gu

ISCII Gujarati

57011

X-Iscii-pa

ISCII Punjabi

65000

UTF-7

Unicode (UTF-7)

65001

UTF-8

Unicode (UTF-8)

Im folgenden Beispiel wird die GetEncoding(Int32) und GetEncoding(String) Methoden zum Abrufen der Griechisch (Windows) code Codierung.Er vergleicht die Encoding die Methodenaufrufe an, dass sie gleich sind, und ordnet zeigt dann den Unicode-Codepunkt und der entsprechenden Codepagewert für jedes Zeichen des griechischen Alphabets zurückgegebenen Objekte.

using System;
using System.Text;

public class Example
{
   public static void Main()
   {
      Encoding enc = Encoding.GetEncoding(1253);
      Encoding altEnc = Encoding.GetEncoding("windows-1253");
      Console.WriteLine("{0} = Code Page {1}: {2}", enc.EncodingName,
                        altEnc.CodePage, enc.Equals(altEnc));
      string greekAlphabet = "Α α Β β Γ γ Δ δ Ε ε Ζ ζ Η η " +
                             "Θ θ Ι ι Κ κ Λ λ Μ μ Ν ν Ξ ξ " +
                             "Ο ο Π π Ρ ρ Σ σ ς Τ τ Υ υ " +
                             "Φ φ Χ χ Ψ ψ Ω ω";
      Console.OutputEncoding = Encoding.UTF8;
      byte[] bytes = enc.GetBytes(greekAlphabet);
      Console.WriteLine("{0,-12} {1,20} {2,20:X2}", "Character",
                        "Unicode Code Point", "Code Page 1253");
      for (int ctr = 0; ctr < bytes.Length; ctr++) {
         if (greekAlphabet[ctr].Equals(' '))
            continue;

         Console.WriteLine("{0,-12} {1,20} {2,20:X2}", greekAlphabet[ctr],
                           GetCodePoint(greekAlphabet[ctr]), bytes[ctr]);
      }
   }

   private static string GetCodePoint(char ch)
   {
      string retVal = "u+";
      byte[] bytes = Encoding.Unicode.GetBytes(ch.ToString());
      for (int ctr = bytes.Length - 1; ctr >= 0; ctr--)
         retVal += bytes[ctr].ToString("X2");

      return retVal;
   }
}
// The example displays the following output:
//       Character      Unicode Code Point       Code Page 1253
//       Α                          u+0391                   C1
//       α                          u+03B1                   E1
//       Β                          u+0392                   C2
//       β                          u+03B2                   E2
//       Γ                          u+0393                   C3
//       γ                          u+03B3                   E3
//       Δ                          u+0394                   C4
//       δ                          u+03B4                   E4
//       Ε                          u+0395                   C5
//       ε                          u+03B5                   E5
//       Ζ                          u+0396                   C6
//       ζ                          u+03B6                   E6
//       Η                          u+0397                   C7
//       η                          u+03B7                   E7
//       Θ                          u+0398                   C8
//       θ                          u+03B8                   E8
//       Ι                          u+0399                   C9
//       ι                          u+03B9                   E9
//       Κ                          u+039A                   CA
//       κ                          u+03BA                   EA
//       Λ                          u+039B                   CB
//       λ                          u+03BB                   EB
//       Μ                          u+039C                   CC
//       μ                          u+03BC                   EC
//       Ν                          u+039D                   CD
//       ν                          u+03BD                   ED
//       Ξ                          u+039E                   CE
//       ξ                          u+03BE                   EE
//       Ο                          u+039F                   CF
//       ο                          u+03BF                   EF
//       Π                          u+03A0                   D0
//       π                          u+03C0                   F0
//       Ρ                          u+03A1                   D1
//       ρ                          u+03C1                   F1
//       Σ                          u+03A3                   D3
//       σ                          u+03C3                   F3
//       ς                          u+03C2                   F2
//       Τ                          u+03A4                   D4
//       τ                          u+03C4                   F4
//       Υ                          u+03A5                   D5
//       υ                          u+03C5                   F5
//       Φ                          u+03A6                   D6
//       φ                          u+03C6                   F6
//       Χ                          u+03A7                   D7
//       χ                          u+03C7                   F7
//       Ψ                          u+03A8                   D8
//       ψ                          u+03C8                   F8
//       Ω                          u+03A9                   D9
//       ω                          u+03C9                   F9

Wenn die zu konvertierenden Daten nur als sequenzielle Blöcke (z. B. aus einem Stream gelesene Daten) verfügbar ist, oder wenn die Datenmenge so groß, dass sie in kleinere Blöcke aufgeteilt werden muss, verwenden Sie ist die Decoder oder die Encoder seitens der GetDecoder Methode oder die GetEncoder -Methode, einer abgeleiteten Klasse.

Die UTF-16 und UTF-32-Encoder können die big-endian-Bytereihenfolge (höchstwertige Byte zuerst) oder die little-endian-Bytereihenfolge (unwichtigste Byte erste).Zum Beispiel folgt der lateinische Großbuchstabe A (U + 0041) als serialisiert wird (hexadezimal):

  • UTF-16 big-endian-Bytereihenfolge: 00 41

  • UTF-16 little-endian-Bytereihenfolge: 41 00

  • UTF-32-big-endian-Bytereihenfolge: 00 00 00 41

  • UTF-32 little-endian-Bytereihenfolge: 41 00 00 00

Es ist im Allgemeinen effizienter, Unicode-Zeichen in der systemeigenen Bytereihenfolge zu speichern.Beispielsweise ist es besser, die little-endian-Bytereihenfolge auf little endian-Plattformen wie Intel-Computern zu verwenden.

Die GetPreamble -Methode ruft ein Array von Bytes, das die Bytereihenfolgemarkierung (BOM) enthält.Wenn dieses Bytearray einem codierten Stream vorangestellt ist, unterstützt es den Decoder verwendeten Codierungsformats.

Weitere Informationen zur Bytereihenfolge und die Bytereihenfolgemarkierung finden Sie im Unicode-Standard auf der Unicode-Homepage.

Beachten Sie, dass die Codierungsklassen Fehler an:

  • Automatische Änderung in ein "?" Zeichen.

  • Verwenden Sie "best fit".

  • Ändern in ein anwendungsspezifisches Verhalten durch Verwendung der EncoderFallback und DecoderFallback Klassen mit dem U + FFFD Unicode-Ersatzzeichen.

Sie sollten eine Ausnahme bei jedem Data Stream-Fehler auslösen.Eine Anwendung verwendet bei Bedarf ein "Throwonerror"-Flag oder verwendet die EncoderExceptionFallback und DecoderExceptionFallback Klassen.Beste Übereinstimmung Fallback wird häufig nicht empfohlen, da dies dazu führen, Daten verloren gehen oder Verwirrung dass kann und langsamer als einfaches Zeichen der Ersetzungen.Bei ANSI-Codierungen ist das am besten geeignete Verhalten der Standard.

Das folgende Beispiel konvertiert eine Zeichenfolge von einer Codierung in eine andere.

System_CAPS_noteHinweis

Das Bytearray [] ist der einzige Typ in diesem Beispiel, das die codierten Daten enthält.Die .NET Char und String-Typen sind selbst Unicode, sodass die GetChars Aufruf die Daten wieder in Unicode decodiert.

using System;
using System.Text;

class Example
{
   static void Main()
   {
      string unicodeString = "This string contains the unicode character Pi (\u03a0)";

      // Create two different encodings.
      Encoding ascii = Encoding.ASCII;
      Encoding unicode = Encoding.Unicode;

      // Convert the string into a byte array.
      byte[] unicodeBytes = unicode.GetBytes(unicodeString);

      // Perform the conversion from one encoding to the other.
      byte[] asciiBytes = Encoding.Convert(unicode, ascii, unicodeBytes);

      // Convert the new byte[] into a char[] and then into a string.
      char[] asciiChars = new char[ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)];
      ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0);
      string asciiString = new string(asciiChars);

      // Display the strings created before and after the conversion.
      Console.WriteLine("Original string: {0}", unicodeString);
      Console.WriteLine("Ascii converted string: {0}", asciiString);
   }
}
// The example displays the following output:
//    Original string: This string contains the unicode character Pi (Π)
//    Ascii converted string: This string contains the unicode character Pi (?)

Universal Windows Platform
Verfügbar seit 4.5
.NET Framework
Verfügbar seit 1.1
Portable Class Library
Unterstützt in: portable .NET platforms
Silverlight
Verfügbar seit 2.0
Windows Phone Silverlight
Verfügbar seit 7.0
Windows Phone
Verfügbar seit 8.1

Öffentliche statische (in Visual Basic freigegebene) Member dieses Typs sind threadsicher. Bei Instanzmembern ist die Threadsicherheit nicht gewährleistet.

Zurück zum Anfang
Anzeigen:
© 2016 Microsoft