KS X 1001(구 명칭 KS C 5601, 명칭 정보 교환용 부호계, 통칭 완성형 한글 코드)은 한국어에서 사용되는 문자를 컴퓨터에서 표현하기 위해 개발된 문자 집합의 일종이다. 한국어의 유닉스 확장 코드(EUC)로도 그대로 쓰여서 EUC-KR이라고도 불린다.
특징
대한민국 국가기술표준원에서 개발·제정하였고, 현재 대한민국의 산업 표준이며, 대한민국 정부의 행정 전산망 등지에서 공식적으로 사용되고 있다.
변천
KS C 5601-1974
당시의 수많은 KS 표준이 그러했듯 일본의 JIS C 6220-1969를 베낀 것이 그 시초로, 1974년 제정되었다. KS C 5601-1974는 7비트 및 8비트 문자 집합으로(당시에는 멀티바이트 문자 인코딩이라는 개념이 없었다) 한글 자음과 모음만을 담고 있어, 실제로 컴퓨터에서 한국어를 처리하기 위한 목적으로 사용하는 것은 사실상 불가능했다.
KS C 5601-1974의 7비트 로마 문자 부호계는 JIS X 0201을 베껴서 그런지 백슬래시(\)가 원화 기호(₩)로, 물결표(~)가 오버라인(‾)으로 바뀌어 있다.
KS C 5601-1987 (현 KS X 1001)
완성형 방식으로, 보통 KS C 5601(KS X 1001)이라 하면 이것을 가리킨다.
구성
- 1행, 2행: 각종 기호
- 3행: 전각 ASCII 문자(백슬래시(\)를 원화 기호(₩)로, 물결표(~)를 오버라인( ̄)으로 바꿈)
- 4행: 한글 자모
- 5행: 로마 숫자, 그리스 문자
- 6행: 괘선 기호
- 7행: 단위 기호
- 8행: 확장 라틴 문자 대문자, 동그라미 안 한글·라틴 문자·숫자, 분수 기호
- 9행: 확장 라틴 문자 소문자, 괄호 안 한글·라틴 문자·숫자, 위 첨자와 아래 첨자
- 10행: 히라가나
- 11행: 가타카나
- 12행: 키릴 문자
- 16행 ~ 40행: 한글 2350자
- 42행 ~ 93행: 한자 4888자
문제점
표현 가능한 한글의 수 부족
한글이 고작 2,350자밖에 지원되지 않는다! 이는 현대 한글 11,172자 중 21%밖에 되지 않는 수치이다. 이 2350자만으로는 표준어조차 다 적을 수 없으며, 외국어·외래어 표기도 잘 되지 않는다. 1987년 당시에는 일반 개인용, 업무용 컴퓨터 성능의 한계 때문에 어쩔 수 없다고 쳐도[1], 1990년대 중후반만 되어도 한글과 한자를 모두 표시하는데 성능은 더 이상 문제가 되지 않을 정도로 컴퓨터 성능이 좋아졌고 지금은 말할 필요도 없다.
유니코드에 모든 현대 한글 11172자가 다 들어간 현재도 KS X 1001의 한글 2350자는 여전히 글꼴 업계에서는 표준적으로 쓰인다. 많은 글꼴 회사가 제작 비용 등을 이유로 저 2350자만 만드는 경우가 많고, 11172자를 모두 지원하는 글꼴을 만들 때도 저 2350자만 직접 디자인하고 나머지 8822자는 일정한 조합 규칙에 따라 자동으로 글리프를 생성해 두는 것이 일반적이다(그래서 나머지 8822자는 저 2350자에 비해 상대적으로 조형미가 떨어진다).
KS X 1001: 1992 부속서 3에선 한글 채움 문자(KS쪽자)를 이용해서 조합형처럼 출력하라지만 그걸 지원 하는 소프트웨어를 해당 규격이 발표된 1997년 그당시에는 찾을 수가 없었다.
KS X 1001의 한글 2350자 목록은 /한글 목록 참고.
고아 한글
뢨, 썅, 쏀, 쓩, 쭁 다섯 글자는 분명히 KS X 1001에 있으나, 받침이 없는 뢔, 쌰, 쎼, 쓔, 쬬가 빠져 있어서 입력이 불가능하다.
한자의 중복 배당
KS X 1001에는 독음이 여러 개인 한자 일부가 중복해서 배당되어 있다. 가장 좋은 예가 樂인데, KS X 1001에는 이 한자가 樂(악), 樂(낙), 樂(락), 樂(요)로, 4개 중복되어 배당되어 있다! 이렇게 중복 배당된 한자가 무려 268자에 달한다!
외국어의 잘못된 표기 유발
주로 KS X 1001에 선언된 문자만을 이용하여 일본어를 표기하려 할 때 발생한다. 현대 일본어에서는 한자를 간소화한 자형인 신자체를 사용하는데, KS X 1001을 이용하여 일본어를 표기하려면 한국 자형의 한자만을 이용해야 한다. 또, 일본어에서 사용되는 특수문자 중 ・(일본식 가운뎃점), 々(일본식 한자 반복 기호), ー(일본식 장음 기호) 등은 역시 할당되어 있지 않아 사용할 수 없다. 이 결과, 일본인조차 잘 읽지 못하는 일본어 문장이 탄생하는데, 백괴사전에서는 이것을 고자 왜말이라고 부른다고 카더라(...).
이것은 엄밀히 말하면 KS X 1001의 문제라고는 말할 수 없다. KS X 1001은 한국어의 전산화를 위해 만들어진 규격으로 외국어 표기에 중점을 두어 설계된 것이 아니기 때문이다.
같이 보기
- 찦차를 타고 온 펲시맨과 쑛다리 똠방각하
- 외계어: 통상적으로 완성형 2,350자 범위 밖에 있어 완성형 폰트에서 정상적으로 표시되지 않는 한글에 대해 일반인들이 부르는 명칭.