KS X 1001

KS X 1001(구 명칭 KS C 5601, 명칭 정보 교환용 부호계, 통칭 완성형 한글 코드)은 한국어에서 사용되는 문자를 컴퓨터에서 표현하기 위해 개발된 문자 집합의 일종이다. 한국어의 유닉스 확장 코드(EUC)로도 그대로 쓰여서 EUC-KR이라고도 불린다.

특징[편집 | 원본 편집]

대한민국 국가기술표준원에서 개발·제정하였고, 현재 대한민국의 산업 표준이며, 대한민국 정부의 행정 전산망 등지에서 공식적으로 사용되고 있다.

변천[편집 | 원본 편집]

KS C 5601-1974[편집 | 원본 편집]

당시의 수많은 KS 표준이 그러했듯 일본의 JIS C 6220-1969베낀 것이 그 시초로, 1974년 제정되었다. KS C 5601-1974는 7비트 및 8비트 문자 집합으로(당시에는 멀티바이트 문자 인코딩이라는 개념이 없었다) 한글 자음과 모음을 담고 있어, 실제로 컴퓨터에서 한국어를 처리하기 위한 목적으로 사용하는 것은 사실상 불가능했다.

KS C 5601-1974의 7비트 로마 문자 부호계는 JIS X 0201을 베껴서 그런지 백슬래시(\)가 원화 기호(₩)로, 물결표(~)가 오버라인(‾)으로 바뀌어 있다.

KS C 5601-1987 (현 KS X 1001)[편집 | 원본 편집]

완성형 방식으로, 보통 KS C 5601(KS X 1001)이라 하면 이것을 가리킨다.

구성[편집 | 원본 편집]

  • 1행, 2행: 각종 기호
  • 3행: 전각 ASCII 문자(백슬래시(\)를 원화 기호(₩)로, 물결표(~)를 오버라인( ̄)으로 바꿈)
  • 4행: 한글 자모
  • 5행: 로마 숫자, 그리스 문자
  • 6행: 괘선 기호
  • 7행: 단위 기호
  • 8행: 확장 라틴 문자 대문자, 동그라미 안 한글·라틴 문자·숫자, 분수 기호
  • 9행: 확장 라틴 문자 소문자, 괄호 안 한글·라틴 문자·숫자, 위 첨자와 아래 첨자
  • 10행: 히라가나
  • 11행: 가타카나
  • 12행: 키릴 문자
  • 16행 ~ 40행: 한글 2350자
  • 42행 ~ 93행: 한자 4888자

문제점[편집 | 원본 편집]

표현 가능한 한글의 수 부족[편집 | 원본 편집]

한글이 고작 2,350자밖에 지원되지 않는다! 이는 현대 한글 11,172자 중 21%밖에 되지 않는 수치이다. 이 2350자만으로는 표준어조차 다 적을 수 없으며, 외국어·외래어 표기도 잘 되지 않는다. 1987년 당시에는 일반 개인용, 업무용 컴퓨터 성능의 한계 때문에 어쩔 수 없다고 쳐도[1], 1990년대 중후반만 되어도 한글과 한자를 모두 표시하는데 성능은 더 이상 문제가 되지 않을 정도로 컴퓨터 성능이 좋아졌고 지금은 말할 필요도 없다.

유니코드에 모든 현대 한글 11172자가 다 들어간 현재도 KS X 1001의 한글 2350자는 여전히 글꼴 업계에서는 표준적으로 쓰인다. 많은 글꼴 회사가 제작 비용 등을 이유로 저 2350자만 만드는 경우가 많고, 11172자를 모두 지원하는 글꼴을 만들 때도 저 2350자만 직접 디자인하고 나머지 8822자는 일정한 조합 규칙에 따라 자동으로 글리프를 생성해 두는 것이 일반적이다(그래서 나머지 8822자는 저 2350자에 비해 상대적으로 조형미가 떨어진다).

한글 채움 문자(KS쪽자, 0xA4D4)를 이용해서 (채움)+(초성)+(중성)+(종성)[2]으로 출력하라지만 그걸 지원 하는 소프트웨어를 해당 규격이 발표된 그당시에는 찾을 수가 없었고 후에 오픈소스 계열 소프트웨어들이 지원하기 시작했다. 참고로 KSC-5601:1992 부속서 3라고 알려진 8바이트 조합형이랑 혼동하는 경우가 많은데 8바이트 조합형은 한글 낱자를 2바이트[3]로 인코딩하기때문에 관련이 없다.

KS X 1001의 한글 2350자 목록은 /한글 목록 참고.

고아 한글[편집 | 원본 편집]

뢨, 썅, 쏀, 쓩, 쭁 다섯 글자는 분명히 KS X 1001에 있으나, 받침이 없는 뢔, 쌰, 쎼, 쓔, 쬬가 빠져 있어서 입력이 불가능하다.

한자의 중복 배당[편집 | 원본 편집]

KS X 1001에는 독음이 여러 개인 한자 일부가 중복해서 배당되어 있다. 가장 좋은 예가 樂인데, KS X 1001에는 이 한자가 樂(악), 樂(낙), 樂(락), 樂(요)로, 4개 중복되어 배당되어 있다! 이렇게 중복 배당된 한자가 무려 268자에 달한다!

외국어의 잘못된 표기 유발[편집 | 원본 편집]

주로 KS X 1001에 선언된 문자만을 이용하여 일본어를 표기하려 할 때 발생한다. 현대 일본어에서는 한자를 간소화한 자형인 신자체를 사용하는데, KS X 1001을 이용하여 일본어를 표기하려면 한국 자형의 한자만을 이용해야 한다. 또, 일본어에서 사용되는 특수문자 중 ・(일본식 가운뎃점), 々(일본식 한자 반복 기호), ー(일본식 장음 기호) 등은 역시 할당되어 있지 않아 사용할 수 없다. 이 결과, 일본인조차 잘 읽지 못하는 일본어 문장이 탄생하는데, 백괴사전에서는 이것을 고자 왜말이라고 부른다고 카더라(...).

이것은 엄밀히 말하면 KS X 1001의 문제라고는 말할 수 없다. KS X 1001은 한국어의 전산화를 위해 만들어진 규격으로 외국어 표기에 중점을 두어 설계된 것이 아니기 때문이다.

같이 보기[편집 | 원본 편집]

추가바람

각주

  1. 인텔의 80386이 발표된 것이 1987년이다. 이전까지는 잘해야 8088을 사용한 XT, 80286을 사용한 AT가 사용되었으며, 한국에서는 이마저도 업무용으로나 도입되었지 일반 개인용으로는 많지 않았고, 애플 2 호환기종, MSX2 호환기종이 가장 널리 일반 가정에 보급된 컴퓨터였다.
  2. 종성이 없을때는 종성 자리에 채움문자를 한번더 삽입한다
  3. 완성자가 8바이트이다.