ascii to unicode 변환 (codepage별 정리)

Ascii to Unicode 변환 (Codepage 별로 정리)

많은 사람들이 ascii에 그냥 00붙는 거 아니냐? 하곤 한다.

- ex) 0x01 --> 0x01 0x00

- ex) 0x0a --> 0x0a 0x00

절반만 맞다.

int MultiByteToWideChar(
UINT CodePage, --- 어떤 unicode로 변환할래?
DWORD dwFlags,
LPCSTR lpMultiByteStr, --- 변환 할 문자열이 담긴 곳
int cbMultiByte,
LPWSTR lpWideCharStr, --- 변환 결과 문자열이 담길 곳
int cchWideChar
);

ascii -> unicode로 변환은 MultiByteToWideChar 함수를 통하는데,

여기서 CodePage에 따라 어떤 유니코드로 변환될 지가 결정된다.

즉, CodePage 값에 따라 Ascii -> Unicode 변환 결과가 달라진다는 말이다.

CodePage 인자만 별도로 나열해 보자.

Value	Description
CP_ACP	ANSI code page
CP_MACCP	Not supported
CP_OEMCP	OEM code page
CP_SYMBOL	Not supported
CP_THREAD_ACP	Not supported
CP_UTF7	UTF-7 code page
CP_UTF8	UTF-8 code page