서로게이트 쌍 및 조합 문자 시퀀스에 대한 유니코드 지원

유니코드 표준은 두 개의 코드 단위 시퀀스로 구성되는 단일 추상 문자로 코딩된 문자 표시로 서로게이트 쌍을 정의합니다. 서로게이트 쌍의 첫 번째 값은 상위 서로게이트로, U+D800에서 U+DBFF 범위의 16비트 코드 값입니다. 서로게이트 쌍의 두 번째 값은 하위 서로게이트로, U+DC00에서 U+DFFF 범위의 값입니다.

유니코드 표준은 하나의 기본 문자와 하나 이상의 결합 문자가 조합된 문자 시퀀스를 정의합니다. 서로게이트 쌍은 기본 문자나 조합 문자를 나타낼 수 있습니다. 서로게이트 쌍 및 문자 시퀀스 결합에 대한 자세한 내용은 Unicode 홈 페이지에서 유니코드 표준을 참조하십시오.

서로게이트 쌍은 32비트 단일 문자를 나타낸다는 점을 기억해야 합니다. 16비트 유니코드 인코딩 값 하나가 정확히 한 문자로 매핑되지 않을 수도 있습니다. 서로게이트 쌍을 사용하면 16비트 유니코드로 인코딩된 시스템에서 유니코드 표준에 따라 문자가 할당되는 백만 개의 코드 포인트를 추가로 지정할 수 있습니다.

.NET Framework는 텍스트 요소를 지원합니다. 텍스트 요소는 단일 문자로 표시되는 텍스트의 단위입니다. 텍스트 요소는 기본 문자, 서로게이트 쌍 또는 조합 문자 시퀀스가 될 수 있습니다. 응용 프로그램에서는 StringInfo 클래스에서 제공하는 메서드를 사용하여 문자열을 텍스트 요소로 나눈 다음 텍스트 요소 전체를 반복할 수 있습니다. StringInfo 클래스를 사용하는 예제는 문자열 인덱싱을 참조하십시오.

참고 항목

개념

.NET Framework의 유니코드

문자열 인덱싱