사용자 정의 영역

사용자 정의 영역(Private Use Area)은 유니코드 영역 중 문자를 개인이 자유롭게 쓸 수 있도록 비워둔 공간을 의미한다. 이 영역에서는 특정 코드에 대해 특정 문자를 정의하지 않으며, 사용자들이 폰트마다 제각각 다른 용도로 사용할 수 있다. 이 때문에 서로 다른 글꼴 간에는 문자 호환이 되지 않는다.

특징[편집 | 원본 편집]

이 영역은 역사적 가치나 보편성이 낮아 유니코드 문자로 공식 정의되지 않는 문자들을 위해 마련되어 있다. 주로 인공 문자가 여기에 해당한다. 사용자마다 필요한 코드 포인트 수가 다르기에, 실질적으로는 아래 언급하는 글자 수보다 훨씬 적게 쓰인다.

아래 유니코드 블록 정보를 보면 알 수 있듯이 사용자 정의 영역 내 전체 글자 수는 '6400+65534×2=137468'로 무지막지하게 많다. 대다수 사람들은 유니코드 표준으로 정의된 문자 외에 사적으로 새롭게 정의할 글자를 많이 만들지 않을 것이나, 일부는 충분한 코드 영역이 필요할 때가 있다. 가령 옛한글이나 공식 배당이 안된 한자와 같은 경우 사용하고자 하는 코드 포인트가 아주 많다. 또, 사용자의 요구가 있을 때마다 사용자 정의 영역을 늘리는 것보다는 처음부터 충분한 공간을 제공하고 범위 변경을 하지 않는 것이 유니코드 시스템을 안정적으로 운용할 수 있다.

유니코드 블록[편집 | 원본 편집]

Private Use Area[편집 | 원본 편집]

Private Use Area
이름의 뜻 사용자 정의 영역
유니코드 평면 BMP
코드 범위 U+E000 ~ U+F8FF
코드 개수 6400
글자 수 6400
미사용 글자 0
종류 사용자 정의 영역
쓰기 방향 미정
이전 블록 Low Surrogates
다음 블록 CJK Compatibility Ideographs
관련 블록 본문 참고
추가된 버전 1.0

Private Use Area는 사용자 정의 영역 중 기본 다국어 평면(BMP)에 들어가 있는 유니코드 블록이다. 유니코드 버전 1.0에서는 원래 U+E800 ~ U+FDFF까지 정의되어 있었고 코드 수는 5632자였다. 그러다가 1.0.1에서 U+E000 ~ U+F7FF 범위가 추가되었고(+2048), 대신 뒷부분인 U+F900 ~ U+FDFF 범위는 CJK Compatibility Ideographs, Alphabetic Presentation Forms, Arabic Presentation Forms-A 블록으로 대신 채워졌다(-1280).[1] 이렇게 해서 6400자 크기의 블록이 만들어졌고 이 버전 이후 계속 굳어져 왔다.

Supplementary Private Use Area-A[편집 | 원본 편집]

Supplementary Private Use Area-A
이름의 뜻 보조 사용자 정의 영역-A
유니코드 평면 PUA-A
코드 범위 U+F0000 ~ U+FFFFF
코드 개수 65536
글자 수 65534
미사용 글자 2
종류 사용자 정의 영역
쓰기 방향 미정
이전 블록 Variation Selectors Supplement
다음 블록 Supplementary Private Use Area-B
관련 블록 본문 참고
추가된 버전 2.0

Supplementary Private Use Area-A는 유니코드 15번 평면 전체에 배당된 유니코드 블록이다. 단, 실질적으로 쓸 수 있는 공간은 U+F0000 ~ U+FFFFD 범위이며, U+FFFFE와 U+FFFFF 자리는 비문자(noncharacters)로 비워져 있다.

Supplementary Private Use Area-B[편집 | 원본 편집]

Supplementary Private Use Area-B
이름의 뜻 보조 사용자 정의 영역-B
유니코드 평면 PUA-B
코드 범위 U+100000 ~ U+10FFFF
코드 개수 65536
글자 수 65534
미사용 글자 2
종류 사용자 정의 영역
쓰기 방향 미정
이전 블록 Supplementary Private Use Area-A
다음 블록 끝 블록
관련 블록 본문 참고
추가된 버전 2.0

Supplementary Private Use Area-B는 유니코드 16번 평면 전체에 배당된 유니코드 블록으로, 전체 유니코드 목록 중 가장 나중에 놓인 영역이다. 이 블록도 바로 위와 마찬가지로 U+100000 ~ U+10FFFD까지 자유롭게 쓸 수 있고, U+10FFFE와 U+10FFFF 자리는 비문자이다.

기타[편집 | 원본 편집]

  • 한컴오피스 한글에서 문자표 창(Ctrl+F10)에서 '유니코드 문자' 탭에 들어가 보면 유니코드 블록 중 '사용자 영역(옛한글 포함)' 항목이 있다. 바로 여기가 BMP에 속한 사용자 정의 영역이며, 한컴오피스에서 자체 정의한 기호 및 옛한글 목록을 볼 수 있다.
  • 리브레 위키에서 이 영역 내 문자를 입력하고 편집을 저장하면 "태그:사용자 영역 문자가 사용됨" 문구가 편집 내역에 표시된다.

관련 사이트[편집 | 원본 편집]

각주

  1. 이 당시에는 유니코드 블록 변경이 아예 막혀 있지 않았으나 2.0부터는 '변경 불가' 원칙이 생겼다.