KS X 1001

최근 편집: 2022년 12월 26일 (월) 11:25

KS X 1001(구 명칭 KS C 5601, 명칭 정보 교환용 부호계, 통칭 완성형 한글 코드)은 한국어에서 사용되는 문자를 컴퓨터에서 표현하기 위해 개발된 문자 집합의 일종이다. 한국어의 유닉스 확장 코드(EUC)로도 그대로 쓰여서 EUC-KR이라고도 불린다.

특징

대한민국 국가기술표준원에서 개발·제정하였고, 현재 대한민국의 산업 표준이며, 대한민국 정부의 행정 전산망 등지에서 공식적으로 사용되고 있다.

변천

KS C 5601-1974

당시의 수많은 KS 표준이 그러했듯 일본의 JIS C 6220-1969베낀 것이 그 시초로, 1974년 제정되었다. KS C 5601-1974는 7비트 및 8비트 문자 집합으로(당시에는 멀티바이트 문자 인코딩이라는 개념이 없었다) 한글 자음과 모음을 담고 있어, 실제로 컴퓨터에서 한국어를 처리하기 위한 목적으로 사용하는 것은 사실상 불가능했다.

KS C 5601-1974의 7비트 로마 문자 부호계는 JIS X 0201을 베껴서 그런지 백슬래시(\)가 원화 기호(₩)로, 물결표(~)가 오버라인(‾)으로 바뀌어 있다.

KS C 5601-1987 (현 KS X 1001)

완성형 방식으로, 보통 KS C 5601(KS X 1001)이라 하면 이것을 가리킨다.

구성

  • 1행, 2행: 각종 기호
  • 3행: 전각 ASCII 문자(백슬래시(\)를 원화 기호(₩)로, 물결표(~)를 오버라인( ̄)으로 바꿈)
  • 4행: 한글 자모
  • 5행: 로마 숫자, 그리스 문자
  • 6행: 괘선 기호
  • 7행: 단위 기호
  • 8행: 확장 라틴 문자 대문자, 동그라미 안 한글·라틴 문자·숫자, 분수 기호
  • 9행: 확장 라틴 문자 소문자, 괄호 안 한글·라틴 문자·숫자, 위 첨자와 아래 첨자
  • 10행: 히라가나
  • 11행: 가타카나
  • 12행: 키릴 문자
  • 16행 ~ 40행: 한글 2350자
  • 42행 ~ 93행: 한자 4888자

문제점

표현 가능한 한글의 수 부족

한글이 고작 2,350자밖에 지원되지 않는다! 이는 현대 한글 11,172자 중 21%밖에 되지 않는 수치이다. 이 2350자만으로는 표준어조차 다 적을 수 없으며, 외국어·외래어 표기도 잘 되지 않는다. 1987년 당시에는 일반 개인용, 업무용 컴퓨터 성능의 한계 때문에 어쩔 수 없다고 쳐도[1], 1990년대 중후반만 되어도 한글과 한자를 모두 표시하는데 성능은 더 이상 문제가 되지 않을 정도로 컴퓨터 성능이 좋아졌고 지금은 말할 필요도 없다.

유니코드에 모든 현대 한글 11172자가 다 들어간 현재도 KS X 1001의 한글 2350자는 여전히 글꼴 업계에서는 표준적으로 쓰인다. 많은 글꼴 회사가 제작 비용 등을 이유로 저 2350자만 만드는 경우가 많고, 11172자를 모두 지원하는 글꼴을 만들 때도 저 2350자만 직접 디자인하고 나머지 8822자는 일정한 조합 규칙에 따라 자동으로 글리프를 생성해 두는 것이 일반적이다(그래서 나머지 8822자는 저 2350자에 비해 상대적으로 조형미가 떨어진다).

KS X 1001: 1992 부속서 3에선 한글 채움 문자(KS쪽자)를 이용해서 조합형처럼 출력하라지만 그걸 지원 하는 소프트웨어를 해당 규격이 발표된 1997년 그당시에는 찾을 수가 없었다.

KS X 1001의 한글 2350자 목록은 /한글 목록 참고.

고아 한글

뢨, 썅, 쏀, 쓩, 쭁 다섯 글자는 분명히 KS X 1001에 있으나, 받침이 없는 뢔, 쌰, 쎼, 쓔, 쬬가 빠져 있어서 입력이 불가능하다.

한자의 중복 배당

KS X 1001에는 독음이 여러 개인 한자 일부가 중복해서 배당되어 있다. 가장 좋은 예가 樂인데, KS X 1001에는 이 한자가 樂(악), 樂(낙), 樂(락), 樂(요)로, 4개 중복되어 배당되어 있다! 이렇게 중복 배당된 한자가 무려 268자에 달한다!

외국어의 잘못된 표기 유발

주로 KS X 1001에 선언된 문자만을 이용하여 일본어를 표기하려 할 때 발생한다. 현대 일본어에서는 한자를 간소화한 자형인 신자체를 사용하는데, KS X 1001을 이용하여 일본어를 표기하려면 한국 자형의 한자만을 이용해야 한다. 또, 일본어에서 사용되는 특수문자 중 ・(일본식 가운뎃점), 々(일본식 한자 반복 기호), ー(일본식 장음 기호) 등은 역시 할당되어 있지 않아 사용할 수 없다. 이 결과, 일본인조차 잘 읽지 못하는 일본어 문장이 탄생하는데, 백괴사전에서는 이것을 고자 왜말이라고 부른다고 카더라(...).

이것은 엄밀히 말하면 KS X 1001의 문제라고는 말할 수 없다. KS X 1001은 한국어의 전산화를 위해 만들어진 규격으로 외국어 표기에 중점을 두어 설계된 것이 아니기 때문이다.

같이 보기

추가바람

출처

  1. 인텔의 80386이 발표된 것이 1987년이다. 이전까지는 잘해야 8088을 사용한 XT, 80286을 사용한 AT가 사용되었으며, 한국에서는 이마저도 업무용으로나 도입되었지 일반 개인용으로는 많지 않았고, 애플 2 호환기종, MSX2 호환기종이 가장 널리 일반 가정에 보급된 컴퓨터였다.