편집을 취소할 수 있습니다. 이 편집을 되돌리려면 아래의 바뀐 내용을 확인한 후 게시해주세요.
최신판 | 당신의 편집 | ||
2번째 줄: | 2번째 줄: | ||
KS X 1002의 현대 한글 1930자는 [http://www.unicode.org/Public/1.1-Update/UnicodeData-1.1.5.txt 유니코드 1.1 데이터]에서 바로 뽑아 낼 수 있다(0x3D2E ~ 0x44B7이 KS X 1002의 현대 한글 1930자에 해당됨). 그런데 유니코드 1.1 데이터에는 두 군데 오류가 있으므로 주의해야 한다([http://www.unicode.org/L2/L2017/17080-three-hangul-syl.pdf 오류를 지적한 문서]). {{취소선|그런데 이 오류를 발견한 것도 정말 신기하다}} | KS X 1002의 현대 한글 1930자는 [http://www.unicode.org/Public/1.1-Update/UnicodeData-1.1.5.txt 유니코드 1.1 데이터]에서 바로 뽑아 낼 수 있다(0x3D2E ~ 0x44B7이 KS X 1002의 현대 한글 1930자에 해당됨). 그런데 유니코드 1.1 데이터에는 두 군데 오류가 있으므로 주의해야 한다([http://www.unicode.org/L2/L2017/17080-three-hangul-syl.pdf 오류를 지적한 문서]). {{취소선|그런데 이 오류를 발견한 것도 정말 신기하다}} | ||
* 0x40BC: '삣'이 아니라 '삤'이 맞음 | * 0x40BC: '삣'이 아니라 '삤'이 맞음 | ||
* 유니코드 1.1 데이터에는 '삣'과 '삤'의 이름과 분해 정보(decomposition mapping)가 뒤바뀌어 있다. 실제로는 0x384E가 '삣(ㅃ+ㅣ+ㅅ)'이고 0x40BC가 '삤(ㅃ+ㅣ+ㅆ)'인데, 유니코드 1.1 데이터에는 0x384E가 '삤(ㅃ+ㅣ+ㅆ)'이고 0x40BC가 '삣(ㅃ+ㅣ+ㅅ)'이라고 잘못 적혀 있다. 참고로 '삣'은 KS X 1001에 있다(유니코드 1.0과 1.1에서 0x3400 ~ 0x3D2D가 KS X 1001의 2350자에 해당됨). | |||
* 0x436C: '콫(ㅋ+ㅗ+ㅊ)'이 아니라 '콪(ㅋ+ㅗ+ㅈ)'이 맞음 | * 0x436C: '콫(ㅋ+ㅗ+ㅊ)'이 아니라 '콪(ㅋ+ㅗ+ㅈ)'이 맞음 | ||
아래 목록과 정규표현식에서는 이 오류들을 고쳤다. | 아래 목록과 정규표현식에서는 이 오류들을 고쳤다. | ||