KS X 1002/한글 목록

< KS X 1002
KSX1002 (토론 | 기여)님의 2017년 4월 11일 (화) 20:42 판 (임시 저장)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

KS X 1002의 현대 한글 1930자 목록이다.

KS X 1002의 현대 한글 1930자는 유니코드 1.1 데이터에서 바로 뽑아 낼 수 있다(0x3D2E ~ 0x44B7이 KS X 1002의 현대 한글 1930자에 해당됨). 그런데 유니코드 1.1 데이터에는 두 군데 오류가 있으므로 주의해야 한다(오류를 지적한 문서). 그런데 이 오류를 발견한 것도 정말 신기하다

* 0x40BC: '삣'이 아니라 '삤'이 맞음
 * 유니코드 1.1 데이터에는 '삣'과 '삤'의 이름과 분해 정보(decomposition mapping)가 뒤바뀌어 있다. 실제로는 0x384E가 '삣(ㅃ+ㅣ+ㅅ)'이고 0x40BC가 '삤(ㅃ+ㅣ+ㅆ)'인데, 유니코드 1.1 데이터에는 0x384E가 '삤(ㅃ+ㅣ+ㅆ)'이고 0x40BC가 '삣(ㅃ+ㅣ+ㅅ)'이라고 잘못 적혀 있다. 참고로 '삣'은 KS X 1001에 있다(유니코드 1.0과 1.1에서 0x3400 ~ 0x3D2D가 KS X 1001의 2350자에 해당됨).
* 0x436C: '콫(ㅋ+ㅗ+ㅊ)'이 아니라 '콪(ㅋ+ㅗ+ㅈ)'이 맞음

아래 목록과 정규표현식에서는 이 오류들을 고쳤다.

목록

정규표현식

유니코드 환경임을 전제로 한다.

같이 보기