GB 18030

최근 편집: 2022년 12월 27일 (화) 09:06

GB 18030GB 2312의 확장으로, 유니코드를 EUC-CN 기반 문자 인코딩에 다 때려 박기 위해 만들어진 문자 코드이다. 2001년 9월부터 중국에서 발매되는 모든 소프트웨어는 반드시 GB 18030을 지원해야 한다.

구성

1, 2, 4바이트 가변폭 문자 코드이다.

  • 1바이트: ASCII (0x00 ~ 0x7F)
  • 2바이트: GBK ([\x81-\xFE][\40-\7E,\x80-\xFE])
  • 4바이트: GBK에 없는 유니코드 문자들을 유니코드 코드 포인트 순서대로 배당함 ([\x81-\xFE][\x30-\x39][\x81-\xFE][\x30-\x39])