Big5

최근 편집: 2022년 12월 27일 (화) 08:56

Big5대만의 큰 다섯 회사가 협력해서 만든 번체자 중국어 표기용 문자 코드이다. 비록 대만의 국가 표준은 아니나 널리 쓰이고 있다.

구조와 구성

Big5는 94×157 구조이다.

  • 첫째 바이트: 0xA1 ~ 0xF9
  • 둘째 바이트: 0x40 ~ 0x7E, 0xA1 ~ 0xFE

각 구에 따른 문자 구성은 다음과 같다.

  • 1구: 각종 기호
  • 2구: 도량형 표기용 한자, 괘선 문자, 대문자 로마 숫자, 전각 라틴 문자, 기타 기호
  • 3구: 전각 라틴 문자, 그리스 문자, 주음부호 등
  • 4구 ~ 38구: 1수준 한자 5401자
  • 41구 ~ 89구: 2수준 한자 7652자

중복 한자

2수준 한자 중에는 실수로 중복 배당된 한자가 두 쌍 있다.

한자 코드 위치
A461, C94A
DCD1, DDFC

그런데 Big5가 비록 국가 표준은 아니나 워낙 널리 쓰이고 있었다 보니 유니코드도 Big5 ↔ 유니코드 왕복 변환을 고려해 주었고, 0xC94A와 0xDDFC에 해당되는 문자는 CJK 호환 한자 영역에 각각 U+FA0C와 U+FA0D로 배당됐다.

확장

Big5의 확장은 ETen(倚天), Big5+, Big-5E, HKSCS 등이 존재한다.