Dieser Artikel wurde maschinell übersetzt. Wenn Sie die englische Version des Artikels anzeigen möchten, aktivieren Sie das Kontrollkästchen Englisch. Sie können den englischen Text auch in einem Popupfenster anzeigen, indem Sie den Mauszeiger über den Text bewegen.
Übersetzung
Englisch

NormalizationForm-Enumeration

 

Veröffentlicht: Oktober 2016

Definiert den Typ der auszuführenden Normalisierung.

Namespace:   System.Text
Assembly:  mscorlib (in mscorlib.dll)

[ComVisibleAttribute(true)]
public enum NormalizationForm

MembernameBeschreibung
FormC

Gibt an, dass eine Unicode-Zeichenfolge mithilfe der vollständigen kanonischen Zerlegung, gefolgt von der Austausch von Sequenzen mit ihren primären kombiniert, wenn möglich normalisiert ist.

FormD

Gibt an, dass eine Unicode-Zeichenfolge mithilfe der vollständigen kanonischen Zerlegung normalisiert wird.

FormKC

Gibt an, dass eine Unicode-Zeichenfolge mit vollständigen Kompatibilität Zerlegung normalisiert wird, gefolgt von der Austausch von Sequenzen mit ihren primären kombiniert, wenn möglich.

FormKD

Gibt an, dass eine Unicode-Zeichenfolge mithilfe der vollständigen Kompatibilität Zerlegung normalisiert ist.

Einige Unicode-Zeichenfolgen werden als äquivalent betrachtet, da sie dasselbe Zeichen darstellen. Beispielsweise werden im folgenden als äquivalent betrachtet, da diese verwendet werden kann, um "ắ" darstellen:

  • "\u1EAF"

  • "\u0103\u0301"

  • "\u0061\u0306\u0301"

Jedoch Ordnungszahl, d. h., Binärvergleiche sollten Sie diese Sequenzen verschiedene da sie verschiedene Unicode-Codewerte enthalten. Vor dem Ausführen von ordinalen vergleichen, müssen Clientanwendungen diese Zeichenfolgen, um sie in die grundlegenden Komponenten zerlegen normalisieren.

Jedes zusammengesetztes Unicode-Zeichen wird einer einfacheren Sequenz aus einem oder mehreren Zeichen zugeordnet. Der Zerlegung werden zusammengesetzte Zeichen in einer Zeichenfolge durch deren einfachere Zuordnung ersetzt. Ein vollständige Zerlegung rekursiv führt diese Ersetzung bis keines der Zeichen in der Zeichenfolge weiter zerlegt werden kann.

Unicode definiert zwei Typen von Zerlegung: Kompatibilität Zerlegung und kanonischen Zerlegung. In Kompatibilität Zerlegung möglicherweise Informationen über die Formatierung verloren. Informationen über die Formatierung ist in kanonischen Zerlegung, also eine Teilmenge der Zerlegung Kompatibilität beibehalten.

Zwei Gruppen von Zeichen werden als kanonische Äquivalenz aufweisen, wenn ihre vollständigen kanonischen Zerlegung identisch sind. Ebenso werden zwei Sätze von Zeichen als Kompatibilität Äquivalenz aufweisen, wenn ihre vollständige Kompatibilität Zerlegung identisch sind.

Weitere Informationen zur Normalisierung, Zerlegung und Entsprechung finden Sie unter Unicode Standard Annex #15: Unicode Normalization Forms unter unicode.org.

Universelle Windows-Plattform
Verfügbar seit 10
.NET Framework
Verfügbar seit 2.0
Zurück zum Anfang
Anzeigen: