이 문서는 기계 번역을 이용하여 번역되었습니다. 문서를 영문으로 보려면 영문 확인란을 선택하세요. 마우스 포인터를 텍스트 위로 이동시켜 팝업 창에서 영문 텍스트를 표시할 수도 있습니다.
번역
영문

Encoding 클래스

 

문자 인코딩을 나타냅니다.

이 유형에 대 한.NET Framework 소스 코드를 찾아보려면 참조는 Reference Source합니다.

네임스페이스:   System.Text
어셈블리:  mscorlib(mscorlib.dll에 있음)


[SerializableAttribute]
[ComVisibleAttribute(true)]
public abstract class Encoding : ICloneable

이름설명
System_CAPS_protmethodEncoding()

Encoding 클래스의 새 인스턴스를 초기화합니다.

System_CAPS_protmethodEncoding(Int32)

지정한 코드 페이지에 해당하는 Encoding 클래스의 새 인스턴스를 초기화합니다.

System_CAPS_protmethodEncoding(Int32, EncoderFallback, DecoderFallback)

지정된 인코더 및 디코더 대체 전략을 사용하여 지정된 코드 페이지에 해당하는 Encoding 클래스의 새 인스턴스를 초기화합니다.

이름설명
System_CAPS_pubpropertySystem_CAPS_staticASCII

ASCII(7비트) 문자 집합에 대한 인코딩을 가져옵니다.

System_CAPS_pubpropertySystem_CAPS_staticBigEndianUnicode

big endian 바이트 순서를 사용하는 UTF-16 형식에 대한 인코딩을 가져옵니다.

System_CAPS_pubpropertyBodyName

파생 클래스에서 재정의되면 메일 에이전트 본문 태그에 사용할 수 있는 현재 인코딩의 이름을 가져옵니다.

System_CAPS_pubpropertyCodePage

파생 클래스에서 재정의되면 현재 Encoding의 코드 페이지 식별자를 가져옵니다.

System_CAPS_pubpropertyDecoderFallback

현재 DecoderFallback 개체에 대한 Encoding 개체를 가져오거나 설정합니다.

System_CAPS_pubpropertySystem_CAPS_staticDefault

운영 체제의 현재 ANSI 코드 페이지에 대한 인코딩을 가져옵니다.

System_CAPS_pubpropertyEncoderFallback

현재 EncoderFallback 개체에 대한 Encoding 개체를 가져오거나 설정합니다.

System_CAPS_pubpropertyEncodingName

파생 클래스에서 재정의되면 현재 인코딩에 대해 사람이 읽을 수 있는 설명을 가져옵니다.

System_CAPS_pubpropertyHeaderName

파생 클래스에서 재정의되면 메일 에이전트 헤더 태그에 사용할 수 있는 현재 인코딩의 이름을 가져옵니다.

System_CAPS_pubpropertyIsBrowserDisplay

파생 클래스에서 재정의되면 현재 인코딩을 브라우저 클라이언트가 내용을 표시하는 데 사용할 수 있는지를 나타내는 값을 가져옵니다.

System_CAPS_pubpropertyIsBrowserSave

파생 클래스에서 재정의되면 현재 인코딩을 브라우저 클라이언트가 내용을 저장하는 데 사용할 수 있는지를 나타내는 값을 가져옵니다.

System_CAPS_pubpropertyIsMailNewsDisplay

파생 클래스에서 재정의되면 현재 인코딩을 메일 및 뉴스 클라이언트가 내용을 표시하는 데 사용할 수 있는지를 나타내는 값을 가져옵니다.

System_CAPS_pubpropertyIsMailNewsSave

파생 클래스에서 재정의되면 현재 인코딩을 메일 및 뉴스 클라이언트가 내용을 저장하는 데 사용할 수 있는지를 나타내는 값을 가져옵니다.

System_CAPS_pubpropertyIsReadOnly

파생 클래스에서 재정의되면 현재 인코딩이 읽기 전용인지를 나타내는 값을 가져옵니다.

System_CAPS_pubpropertyIsSingleByte

파생 클래스에서 재정의되면 현재 인코딩이 단일 바이트 코드 포인트를 사용하는지를 나타내는 값을 가져옵니다.

System_CAPS_pubpropertySystem_CAPS_staticUnicode

little endian 바이트 순서를 사용하는 UTF-16 형식에 대한 인코딩을 가져옵니다.

System_CAPS_pubpropertySystem_CAPS_staticUTF32

little endian 바이트 순서를 사용하는 UTF-32 형식에 대한 인코딩을 가져옵니다.

System_CAPS_pubpropertySystem_CAPS_staticUTF7

UTF-7 형식에 대한 인코딩을 가져옵니다.

System_CAPS_pubpropertySystem_CAPS_staticUTF8

UTF-8 형식에 대한 인코딩을 가져옵니다.

System_CAPS_pubpropertyWebName

파생 클래스에서 재정의되면 현재 인코딩에 대해 IANA(Internet Assigned Numbers Authority)에 등록된 이름을 가져옵니다.

System_CAPS_pubpropertyWindowsCodePage

파생 클래스에서 재정의되면 현재 인코딩과 가장 비슷한 Windows 운영 체제 코드 페이지를 가져옵니다.

이름설명
System_CAPS_pubmethodClone()

파생 클래스에서 재정의되면 현재 Encoding 개체의 부분 복사본을 만듭니다.

System_CAPS_pubmethodSystem_CAPS_staticConvert(Encoding, Encoding, Byte[])

전체 바이트 배열의 인코딩을 변환합니다.

System_CAPS_pubmethodSystem_CAPS_staticConvert(Encoding, Encoding, Byte[], Int32, Int32)

바이트 배열의 바이트 범위를 한 인코딩에서 다른 인코딩으로 변환합니다.

System_CAPS_pubmethodEquals(Object)

지정한 Object가 현재 인스턴스와 같은지를 확인합니다.(Object.Equals(Object)을(를) 재정의함)

System_CAPS_protmethodFinalize()

개체가 가비지 수집자에서 회수되기 전에, 해당 개체에서 리소스를 해제하고 다른 정리 작업을 수행할 수 있게 합니다. (Object에서 상속됨)

System_CAPS_pubmethodGetByteCount(Char*, Int32)

파생 클래스에서 재정의되면 지정한 문자 포인터에서 시작하는 문자 집합을 인코딩하여 생성되는 바이트 수를 계산합니다.

System_CAPS_pubmethodGetByteCount(Char[])

파생 클래스에서 재정의되면 지정한 문자 배열의 모든 문자를 인코딩하여 생성되는 바이트 수를 계산합니다.

System_CAPS_pubmethodGetByteCount(Char[], Int32, Int32)

파생 클래스에서 재정의되면 지정한 문자 배열의 문자 집합을 인코딩하여 생성되는 바이트 수를 계산합니다.

System_CAPS_pubmethodGetByteCount(String)

파생 클래스에서 재정의되면 지정된 문자열의 문자를 인코딩하여 생성되는 바이트 수를 계산합니다.

System_CAPS_pubmethodGetBytes(Char*, Int32, Byte*, Int32)

파생 클래스에서 재정의되면 지정한 문자 포인터에서 시작하는 문자 집합을 지정한 바이트 포인터에서 시작하여 저장되는 바이트 시퀀스로 인코딩합니다.

System_CAPS_pubmethodGetBytes(Char[])

파생 클래스에서 재정의되면 지정한 문자 배열의 모든 문자를 바이트 시퀀스로 인코딩합니다.

System_CAPS_pubmethodGetBytes(Char[], Int32, Int32)

파생 클래스에서 재정의되면 지정한 문자 배열의 문자 집합을 바이트 시퀀스로 인코딩합니다.

System_CAPS_pubmethodGetBytes(Char[], Int32, Int32, Byte[], Int32)

파생 클래스에서 재정의되면 지정한 문자 배열의 문자 집합을 지정한 바이트 배열로 인코딩합니다.

System_CAPS_pubmethodGetBytes(String)

파생 클래스에서 재정의되면 지정한 문자열의 모든 문자를 바이트 시퀀스로 인코딩합니다.

System_CAPS_pubmethodGetBytes(String, Int32, Int32, Byte[], Int32)

파생 클래스에서 재정의되면 지정한 문자열의 문자 집합을 지정한 바이트 배열로 인코딩합니다.

System_CAPS_pubmethodGetCharCount(Byte*, Int32)

파생 클래스에서 재정의되면 지정한 바이트 포인터에서 시작하는 바이트 시퀀스를 디코딩하여 생성되는 문자 수를 계산합니다.

System_CAPS_pubmethodGetCharCount(Byte[])

파생 클래스에서 재정의되면 지정한 바이트 배열의 모든 바이트를 디코딩하여 생성되는 문자 수를 계산합니다.

System_CAPS_pubmethodGetCharCount(Byte[], Int32, Int32)

파생 클래스에서 재정의되면 지정한 바이트 배열의 바이트 시퀀스를 디코딩하여 생성되는 문자 수를 계산합니다.

System_CAPS_pubmethodGetChars(Byte*, Int32, Char*, Int32)

파생 클래스에서 재정의되면 지정한 바이트 포인터에서 시작하는 바이트 시퀀스를 지정한 문자 포인터에서 시작하여 저장되는 문자 집합으로 디코딩합니다.

System_CAPS_pubmethodGetChars(Byte[])

파생 클래스에서 재정의되면 지정한 바이트 배열의 모든 바이트를 문자 집합으로 디코딩합니다.

System_CAPS_pubmethodGetChars(Byte[], Int32, Int32)

파생 클래스에서 재정의되면 지정한 바이트 배열의 바이트 시퀀스를 문자 집합으로 디코딩합니다.

System_CAPS_pubmethodGetChars(Byte[], Int32, Int32, Char[], Int32)

파생 클래스에서 재정의되면 지정한 바이트 배열의 바이트 시퀀스를 지정한 문자 배열로 디코딩합니다.

System_CAPS_pubmethodGetDecoder()

파생 클래스에서 재정의되면 인코딩된 바이트 시퀀스를 문자 시퀀스로 변환하는 디코더를 가져옵니다.

System_CAPS_pubmethodGetEncoder()

파생 클래스에서 재정의되면 유니코드 문자 시퀀스를 인코딩된 바이트 시퀀스로 변환하는 인코더를 가져옵니다.

System_CAPS_pubmethodSystem_CAPS_staticGetEncoding(Int32)

지정한 코드 페이지 식별자와 관련된 인코딩을 반환합니다.

System_CAPS_pubmethodSystem_CAPS_staticGetEncoding(Int32, EncoderFallback, DecoderFallback)

지정한 코드 페이지 식별자와 관련된 인코딩을 반환합니다. 매개 변수는 인코딩할 수 없는 문자 및 디코딩할 수 없는 바이트 시퀀스에 대한 오류 처리기를 지정합니다.

System_CAPS_pubmethodSystem_CAPS_staticGetEncoding(String)

지정한 코드 페이지 이름과 관련된 인코딩을 반환합니다.

System_CAPS_pubmethodSystem_CAPS_staticGetEncoding(String, EncoderFallback, DecoderFallback)

지정한 코드 페이지 이름과 관련된 인코딩을 반환합니다. 매개 변수는 인코딩할 수 없는 문자 및 디코딩할 수 없는 바이트 시퀀스에 대한 오류 처리기를 지정합니다.

System_CAPS_pubmethodSystem_CAPS_staticGetEncodings()

모든 인코딩을 포함하는 배열을 반환합니다.

System_CAPS_pubmethodGetHashCode()

현재 인스턴스의 해시 코드를 반환합니다.(Object.GetHashCode()을(를) 재정의함)

System_CAPS_pubmethodGetMaxByteCount(Int32)

파생 클래스에서 재정의되면 지정한 문자 수의 문자를 인코딩하여 만들 바이트 수를 계산합니다.

System_CAPS_pubmethodGetMaxCharCount(Int32)

파생 클래스에서 재정의되면 지정한 수의 바이트를 디코딩하여 생성되는 최대 문자 수를 계산합니다.

System_CAPS_pubmethodGetPreamble()

파생 클래스에서 재정의되면 사용되는 인코딩을 지정하는 바이트 시퀀스를 반환합니다.

System_CAPS_pubmethodGetString(Byte*, Int32)

파생 클래스에서 재정의할 때 지정된 주소에서 시작하는 지정된 바이트 수를 문자열로 디코딩합니다.

System_CAPS_pubmethodGetString(Byte[])

파생 클래스에서 재정의되면 지정한 바이트 배열의 모든 바이트를 문자열로 디코딩합니다.

System_CAPS_pubmethodGetString(Byte[], Int32, Int32)

파생 클래스에서 재정의되면 지정한 바이트 배열의 바이트 시퀀스를 문자열로 디코딩합니다.

System_CAPS_pubmethodGetType()

현재 인스턴스의 Type을 가져옵니다.(Object에서 상속됨)

System_CAPS_pubmethodIsAlwaysNormalized()

기본 정규화 형식을 사용하여 현재 인코딩이 항상 정규화되는지를 나타내는 값을 가져옵니다.

System_CAPS_pubmethodIsAlwaysNormalized(NormalizationForm)

파생 클래스에서 재정의되면 지정한 정규화 형식을 사용하여 현재 인코딩이 항상 정규화되는지를 나타내는 값을 가져옵니다.

System_CAPS_protmethodMemberwiseClone()

현재 Object의 단순 복사본을 만듭니다.(Object에서 상속됨)

System_CAPS_pubmethodSystem_CAPS_staticRegisterProvider(EncodingProvider)

인코딩 공급자를 등록합니다.

System_CAPS_pubmethodToString()

현재 개체를 나타내는 문자열을 반환합니다.(Object에서 상속됨)

System_CAPS_note참고

이 유형에 대 한.NET Framework 소스 코드를 보려면 참조는 Reference Source합니다. 온라인 소스 코드, 오프 라인으로 보기에 대 한 참조를 다운로드 및 디버깅 하는 동안 소스 (패치 및 업데이트 포함)를 단계별로 실행 합니다. see instructions.

인코딩은 유니코드 문자 집합을 바이트 시퀀스로 변환하는 프로세스입니다. 반면 디코딩은 인코딩된 바이트 시퀀스를 유니코드 문자 집합으로 변환 하는 프로세스입니다. 유니코드 변환 형식 (Utf) 및 다른 인코딩을 지원에 대 한 내용은 Encoding, 참조 .NET Framework의 문자 인코딩합니다.

Encoding 바이트 배열과 같은 임의의 이진 데이터 대신 유니코드 문자에서 작동 하도록 되어 있습니다. 임의의 이진 데이터를 텍스트로 인코딩해야, 경우에와 같은 방법으로 구현 하는 uuencode와 같은 프로토콜을 사용 해야 Convert.ToBase64CharArray합니다.

.NET Framework의 다음 구현에서 제공 된 Encoding 현재 유니코드 인코딩 및 기타 인코딩을 지원 하기 위해 클래스:

  • ASCIIEncoding 단일 7 비트 ASCII 문자를 유니코드 문자를 인코딩합니다. 이 인코딩은 U + 사이의 문자 값만 지원 0000 및 U + 007F 합니다. 코드 페이지 20127입니다. 통해서도 사용할 수는 ASCII 속성입니다.

  • UTF7Encoding u t F-7 인코딩을 사용 하 여 유니코드 문자를 인코딩합니다. 이 인코딩은 모든 유니코드 문자 값을 지원합니다. 코드 페이지 65000입니다. 통해서도 사용할 수는 UTF7 속성입니다.

  • UTF8Encoding utf-8 인코딩을 사용 하 여 유니코드 문자를 인코딩합니다. 이 인코딩은 모든 유니코드 문자 값을 지원합니다. 코드 페이지 65001입니다. 통해서도 사용할 수는 UTF8 속성입니다.

  • UnicodeEncoding utf-16 인코딩을 사용 하 여 유니코드 문자를 인코딩합니다. Little endian 및 big endian 바이트 순서가 둘 다 지원 됩니다. 통해서도 사용할 수는 Unicode 속성 및 BigEndianUnicode 속성입니다.

  • UTF32Encoding u t F-32 인코딩을 사용 하 여 유니코드 문자를 인코딩합니다. Little endian (코드 페이지 12000)와 (코드 페이지 12001) big endian 바이트 순서가 지원 됩니다. 통해서도 사용할 수는 UTF32 속성입니다.

Encoding 클래스는 주로 다른 인코딩과 유니코드 간 변환 합니다. 종종 파생 중 하나는 앱에 대 한 올바른 선택입니다.

사용 하 여는 GetEncoding 다른 인코딩을 얻는 메서드를 호출 하 고는 GetEncodings 모든 인코딩 목록을 가져오려면 메서드.

다음 표에서.NET Framework에서 지원 되는 인코딩은 나열 합니다. 각 인코딩의 코드 페이지 번호와 인코딩의 값 나열 EncodingInfo.NameEncodingInfo.DisplayName 속성입니다. 마지막 열에 별표를 코드 페이지는 기본 플랫폼에 관계 없이.NET Framework에서 기본적으로 지원 나타냅니다. 참고 코드 인을 페이징 EncodingInfo.Name 국제 표준에 해당 하는 속성 전체 해당 표준 준수 하지 않는 합니다.

코드 페이지

이름

표시 이름

.NET framework 지원

37

IBM037

IBM EBCDIC (미국과 캐나다)

437

IBM437

OEM United States

500

IBM500

IBM EBCDIC (국제)

708

ASMO 708

아랍어 (ASMO 708)

720

DOS 720

아랍어 (DOS)

737

ibm737

그리스어 (DOS)

775

ibm775

발트어 (DOS)

850

ibm850

서유럽어 (DOS)

852

ibm852

중앙 유럽어 (DOS)

855

IBM855

OEM 키릴 자모

857

ibm857

터키어 (DOS)

858

IBM00858

OEM 다국 라틴 문자 I

860

IBM860

포르투갈어 (DOS)

861

ibm861

아이슬란드어 (DOS)

862

DOS 862

히브리어 (DOS)

863

IBM863

프랑스어 캐나다 (DOS)

864

IBM864

아랍어 (864)

865

IBM865

북유럽 (DOS)

866

cp866

키릴 자모 (DOS)

869

ibm869

그리스어, 최신 (DOS)

870

IBM870

IBM EBCDIC (다국어 라틴어-2)

874

windows-874

태국어 (Windows)

875

cp875

IBM EBCDIC (현대 그리스어)

932

shift_jis

일본어 (SHIFT-JIS)

936

gb2312

중국어 간체 (GB2312)

949

ks_c_5601-1987

한국어

950

big5

중국어 번체 (Big5)

1026

IBM1026

IBM EBCDIC (터키어 라틴어-5)

1047

IBM01047

IBM 라틴어-1

1140

IBM01140

IBM EBCDIC (미국 캐나다 유럽)

1141

IBM01141

IBM EBCDIC (독일 유럽)

1142

IBM01142

IBM EBCDIC (덴마크) (노르웨이 유럽)

1143

IBM01143

IBM EBCDIC (핀란드 스웨덴 유럽)

1144

IBM01144

IBM EBCDIC (미국-유럽)

1145

IBM01145

IBM EBCDIC (스페인 유럽)

1146

IBM01146

IBM EBCDIC (영국 유럽)

1147

IBM01147

IBM EBCDIC (프랑스 유럽)

1148

IBM01148

IBM EBCDIC (국제 유럽)

1149

IBM01149

IBM EBCDIC (아이슬란드어 유럽)

1200

u t f-16

유니코드(Unicode)

1201

unicodeFFFE

유니코드 (Big endian)

1250

windows-1250

중앙 유럽어 (Windows)

1251

windows 1251

키릴 자모 (Windows)

1252

Windows-1252

서유럽어 (Windows)

1253

windows-1253

그리스어 (Windows)

1254

windows-1254

터키어 (Windows)

1255

windows-1255

히브리어 (Windows)

1256

windows-1256

아랍어 (Windows)

1257

windows-1257

발트어 (Windows)

1258

windows-1258

베트남어 (Windows)

1361

조합

한국어 (조합)

10000

macintosh

서유럽어 (Mac)

10001

x-mac-일본어

일본어 (Mac)

10002

x-mac-중국어 번체

중국어 번체 (Mac)

10003

x-mac-한국어

한국어 (Mac)

10004

x-mac-아랍어

아랍어 (Mac)

10005

x-mac-히브리어

히브리어 (Mac)

10006

x-mac-그리스어

그리스어 (Mac)

10007

x-mac-키릴 자모

키릴 자모 (Mac)

10008

x-mac-chinesesimp

중국어 간체 (Mac)

10010

x-mac-루마니아어

루마니아어 (Mac)

10017

x-mac-우크라이나어

우크라이나어 (Mac)

10021

x-mac-태국어

태국어 (Mac)

10029

x-mac-ce

중앙 유럽어 (Mac)

10079

x-mac-아이슬란드어

아이슬란드어 (Mac)

10081

x-mac-터키어

터키어 (Mac)

10082

x-mac-크로아티아어

크로아티아어 (Mac)

12000

u t f-32

유니코드 (u t F-32)

12001

utf-32be

유니코드 (u t F-32 Big endian)

20000

x-중국어-CN

중국어 번체 (CN)

20001

x cp20001

TCA 대만

20002

x-중국어-Eten

중국어 번체 (Eten)

20003

x cp20003

IBM5550 대만

20004

x cp20004

방송 대만

20005

x cp20005

Wang 대만

20105

x IA5

서유럽어 (IA5)

20106

x-IA5-독일어

독일어 (IA5)

20107

x-IA5-스웨덴어

스웨덴어 (IA5)

20108

--노르웨이어 IA5 x

노르웨이어 (IA5)

20127

us ascii

US-ASCII

20261

x cp20261

T.61

20269

x cp20269

ISO 6937

20273

IBM273

IBM EBCDIC (독일)

20277

IBM277

IBM EBCDIC (덴마크 노르웨이)

20278

IBM278

IBM EBCDIC (핀란드 스웨덴)

20280

IBM280

IBM EBCDIC (미국)

20284

IBM284

IBM EBCDIC (스페인)

20285

IBM285

IBM EBCDIC (영국)

20290

IBM290

IBM EBCDIC (일본어 가타카나)

20297

IBM297

IBM EBCDIC (프랑스)

20420

IBM420

IBM EBCDIC (아랍어)

20423

IBM423

IBM EBCDIC (그리스어)

20424

IBM424

IBM EBCDIC (히브리어)

20833

x-EBCDIC-KoreanExtended

IBM EBCDIC (확장 한국어)

20838

IBM 태국어

IBM EBCDIC (태국어)

20866

koi8-r

키릴 자모 (KOI8 R)

20871

IBM871

IBM EBCDIC (아이슬란드어)

20880

IBM880

IBM EBCDIC (키릴 자모 러시아어)

20905

IBM905

IBM EBCDIC (터키어)

20924

IBM00924

IBM 라틴어-1

20932

EUC-JP

일본어 (JIS 0208-1990 및 0212-1990)

20936

x cp20936

중국어 간체 (GB2312-80)

20949

x cp20949

한국어 (완성)

21025

cp1025

IBM EBCDIC (키릴 자모 세르비아어 불가리아어)

21866

koi8 u

키릴 자모 (KOI8-U)

28591

iso-8859-1

서유럽어 (ISO)

28592

iso 8859-2

중앙 유럽어 (ISO)

28593

iso 8859-3

라틴어 3 (ISO)

28594

iso 8859-4

발트어 (ISO)

28595

iso-8859-5

키릴 자모 (ISO)

28596

iso 8859-6

아랍어 (ISO)

28597

iso 8859-7

그리스어 (ISO)

28598

iso-8859-8

히브리어 (Iso-visual)

28599

iso-8859-9

터키어 (ISO)

28603

iso 8859-13

에스토니아어 (ISO)

28605

-8859-15

라틴어 9 (ISO)

29001

x 갈릴레이

갈릴레이

38598

iso 8859-8 i

히브리어 (ISO 논리)

50220

--jp 2022 iso

일본어 (JIS)

50221

csISO2022JP

일본어 (Jis-allow 1 byte Kana)

50222

--jp 2022 iso

일본어 (Jis-allow 1 byte Kana-따라서 / SI)

50225

--kr 2022 iso

한국어 (ISO)

50227

x cp50227

중국어 간체 (iso-2022)

51932

euc jp

일본어 (EUC)

51936

EUC-CN

중국어 간체 (EUC)

51949

euc kr

한국어 (EUC)

52936

hz-gb-2312

중국어 간체 (HZ)

54936

GB18030

중국어 간체 (GB18030)

57002

x-iscii-de

ISCII 데바나가리어

57003

x iscii 수

ISCII 벵골어

57004

x-iscii-ta

ISCII 타밀어

57005

x-iscii-te

ISCII 텔루구어

57006

x iscii로

ISCII 아샘어

57007

x-iscii 또는

ISCII 오리야어

57008

x-iscii-ka

ISCII 카나다어

57009

x iscii ma

ISCII 말라얄람어

57010

x-iscii-gu

ISCII 구자라트어

57011

x-iscii-pa

ISCII 펀잡어

65000

u t f-7

유니코드 (utf-7)

65001

u t f-8

유니코드(UTF-8)

다음 예제에서는 GetEncoding(Int32)GetEncoding(String) 그리스어 (Windows)를 가져오는 메서드를 코드 페이지 인코딩. 비교는 Encoding 를 표시 하 고 동일한, 지도 그리스어 알파벳에서 유니코드 코드 포인트 및 각 문자에 대 한 해당 코드 페이지 값을 표시 한 다음 메서드 호출에 의해 반환 되는 개체입니다.

using System;
using System.Text;

public class Example
{
   public static void Main()
   {
      Encoding enc = Encoding.GetEncoding(1253);
      Encoding altEnc = Encoding.GetEncoding("windows-1253");
      Console.WriteLine("{0} = Code Page {1}: {2}", enc.EncodingName,
                        altEnc.CodePage, enc.Equals(altEnc));
      string greekAlphabet = "Α α Β β Γ γ Δ δ Ε ε Ζ ζ Η η " +
                             "Θ θ Ι ι Κ κ Λ λ Μ μ Ν ν Ξ ξ " +
                             "Ο ο Π π Ρ ρ Σ σ ς Τ τ Υ υ " +
                             "Φ φ Χ χ Ψ ψ Ω ω";
      Console.OutputEncoding = Encoding.UTF8;
      byte[] bytes = enc.GetBytes(greekAlphabet);
      Console.WriteLine("{0,-12} {1,20} {2,20:X2}", "Character",
                        "Unicode Code Point", "Code Page 1253");
      for (int ctr = 0; ctr < bytes.Length; ctr++) {
         if (greekAlphabet[ctr].Equals(' '))
            continue;

         Console.WriteLine("{0,-12} {1,20} {2,20:X2}", greekAlphabet[ctr],
                           GetCodePoint(greekAlphabet[ctr]), bytes[ctr]);
      }
   }

   private static string GetCodePoint(char ch)
   {
      string retVal = "u+";
      byte[] bytes = Encoding.Unicode.GetBytes(ch.ToString());
      for (int ctr = bytes.Length - 1; ctr >= 0; ctr--)
         retVal += bytes[ctr].ToString("X2");

      return retVal;
   }
}
// The example displays the following output:
//       Character      Unicode Code Point       Code Page 1253
//       Α                          u+0391                   C1
//       α                          u+03B1                   E1
//       Β                          u+0392                   C2
//       β                          u+03B2                   E2
//       Γ                          u+0393                   C3
//       γ                          u+03B3                   E3
//       Δ                          u+0394                   C4
//       δ                          u+03B4                   E4
//       Ε                          u+0395                   C5
//       ε                          u+03B5                   E5
//       Ζ                          u+0396                   C6
//       ζ                          u+03B6                   E6
//       Η                          u+0397                   C7
//       η                          u+03B7                   E7
//       Θ                          u+0398                   C8
//       θ                          u+03B8                   E8
//       Ι                          u+0399                   C9
//       ι                          u+03B9                   E9
//       Κ                          u+039A                   CA
//       κ                          u+03BA                   EA
//       Λ                          u+039B                   CB
//       λ                          u+03BB                   EB
//       Μ                          u+039C                   CC
//       μ                          u+03BC                   EC
//       Ν                          u+039D                   CD
//       ν                          u+03BD                   ED
//       Ξ                          u+039E                   CE
//       ξ                          u+03BE                   EE
//       Ο                          u+039F                   CF
//       ο                          u+03BF                   EF
//       Π                          u+03A0                   D0
//       π                          u+03C0                   F0
//       Ρ                          u+03A1                   D1
//       ρ                          u+03C1                   F1
//       Σ                          u+03A3                   D3
//       σ                          u+03C3                   F3
//       ς                          u+03C2                   F2
//       Τ                          u+03A4                   D4
//       τ                          u+03C4                   F4
//       Υ                          u+03A5                   D5
//       υ                          u+03C5                   F5
//       Φ                          u+03A6                   D6
//       φ                          u+03C6                   F6
//       Χ                          u+03A7                   D7
//       χ                          u+03C7                   F7
//       Ψ                          u+03A8                   D8
//       ψ                          u+03C8                   F8
//       Ω                          u+03A9                   D9
//       ω                          u+03C9                   F9

변환할 데이터 (예: 스트림에서 읽은 데이터) 순차 블록 에서만에서 사용할 수 있거나 데이터 양이 너무 커서 여러 개의 작은 블록으로 나눌 수 하는 데 필요한 사용 해야 하는 경우는 Decoder 또는 Encoder 에서 제공 되는 GetDecoder 메서드 또는 GetEncoder 메서드를 각각 파생된 된 클래스의 합니다.

U t F-16과 u t F-32 인코더 big endian 바이트 순서를 사용할 수 있습니다 (가장 중요 한 바이트 첫 번째) 또는 little endian 바이트 순서 (최하위 바이트 먼저). 예를 들어 한 (U + 0041)으로 serialize 되는 영문 대문자 (16 진수)에 따릅니다.

  • Utf-16 big endian 바이트 순서: 00 41

  • Utf-16 little endian 바이트 순서: 41 00

  • U t F-32 big endian 바이트 순서: 00 00 00 41

  • U t F-32 little endian 바이트 순서: 41 00 00 00

일반적으로 네이티브 바이트 순서를 사용 하 여 유니코드 문자를 저장 하 여 더 효율적입니다. 예를 들어, little endian 플랫폼 Intel 컴퓨터 등 little endian 바이트 순서를 사용 하는 것이 좋습니다.

GetPreamble 메서드는 바이트 순서 표시 (BOM)를 포함 하는 바이트의 배열을 검색 합니다. 바이트 배열이 인코딩된 스트림의 접두어로 추가 되는, 디코더가 사용 된 인코딩 형식을 식별 하는 데 도움이 됩니다.

바이트 순서 및 바이트 순서 표시에 대 한 자세한 내용은 유니코드 표준을 참조는 Unicode home page합니다.

인코딩 클래스에는 오류를 허용 하는 참고:

  • 자동는 "?" 문자입니다.

  • "가장 적합 한" 문자를 사용 합니다.

  • 사용 하는 응용 프로그램별 동작을 변경 된 EncoderFallbackDecoderFallback 유니코드 U + FFFD 대체 문자로 클래스입니다.

데이터 스트림 오류 예외를 throw 해야 합니다. 응용 프로그램 또는 해당 하는 경우에 "throwonerror" 플래그를 사용 하 여 사용 하는 EncoderExceptionFallbackDecoderExceptionFallback 클래스입니다. 단순한 문자 대체 보다 느립니다 하 고 데이터 손실이 나 혼동 발생할 수 있으므로 자동 맞춤된 대체 하지 않는 좋습니다. ANSI 인코딩을 자동 맞춤된 동작이 기본값입니다.

다음 예제에서는 한 인코딩에서 다른 문자열로 변환 합니다.

System_CAPS_note참고

Byte 배열은 인코딩된 데이터를 포함 하는이 예제에서 유일한 형식입니다. .NET 문자 및 문자열 형식을 사용 하는 유니코드 이므로 GetChars 호출 유니코드 데이터를 다시 디코딩합니다.

using System;
using System.Text;

class Example
{
   static void Main()
   {
      string unicodeString = "This string contains the unicode character Pi (\u03a0)";

      // Create two different encodings.
      Encoding ascii = Encoding.ASCII;
      Encoding unicode = Encoding.Unicode;

      // Convert the string into a byte array.
      byte[] unicodeBytes = unicode.GetBytes(unicodeString);

      // Perform the conversion from one encoding to the other.
      byte[] asciiBytes = Encoding.Convert(unicode, ascii, unicodeBytes);

      // Convert the new byte[] into a char[] and then into a string.
      char[] asciiChars = new char[ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)];
      ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0);
      string asciiString = new string(asciiChars);

      // Display the strings created before and after the conversion.
      Console.WriteLine("Original string: {0}", unicodeString);
      Console.WriteLine("Ascii converted string: {0}", asciiString);
   }
}
// The example displays the following output:
//    Original string: This string contains the unicode character Pi (Π)
//    Ascii converted string: This string contains the unicode character Pi (?)

유니버설 Windows 플랫폼
8 이후 사용 가능
.NET Framework
1.1 이후 사용 가능
이식 가능한 클래스 라이브러리
이식 가능한 .NET 플랫폼 에서 지원됨
Silverlight
2.0 이후 사용 가능
Windows Phone Silverlight
7.0 이후 사용 가능
Windows Phone
8.1 이후 사용 가능

이 형식의 모든 public static(Visual Basic의 공유 Visual Basic의 경우) 멤버는 스레드로부터 안전합니다. 인스턴스 멤버는 스레드로부터의 안전이 보장되지 않습니다.

맨 위로 이동
표시: