Big5는 대만의 큰 다섯 회사가 협력해서 만든 번체자 중국어 표기용 문자 코드이다. 비록 대만의 국가 표준은 아니나 널리 쓰이고 있다.
구조와 구성
Big5는 94×157 구조이다.
- 첫째 바이트: 0xA1 ~ 0xF9
- 둘째 바이트: 0x40 ~ 0x7E, 0xA1 ~ 0xFE
각 구에 따른 문자 구성은 다음과 같다.
- 1구: 각종 기호
- 2구: 도량형 표기용 한자, 괘선 문자, 대문자 로마 숫자, 전각 라틴 문자, 기타 기호
- 3구: 전각 라틴 문자, 그리스 문자, 주음부호 등
- 4구 ~ 38구: 1수준 한자 5401자
- 41구 ~ 89구: 2수준 한자 7652자
중복 한자
2수준 한자 중에는 실수로 중복 배당된 한자가 두 쌍 있다.
한자 | 코드 위치 |
---|---|
兀 | A461 , C94A
|
嗀 | DCD1 , DDFC
|
그런데 Big5가 비록 국가 표준은 아니나 워낙 널리 쓰이고 있었다 보니 유니코드도 Big5 ↔ 유니코드 왕복 변환을 고려해 주었고, 0xC94A와 0xDDFC에 해당되는 문자는 CJK 호환 한자 영역에 각각 U+FA0C와 U+FA0D로 배당됐다.
확장
Big5의 확장은 ETen(倚天), Big5+, Big-5E, HKSCS 등이 존재한다.