바이트

바이트(Byte)는 비트의 집합으로 구성된 정보단위다. 8비트를 1바이트로 하는 것이 일반적이나 과거에는 4비트, 6비트 등 다른 값을 사용하기도 하였다. 지금은 통상적으로 8bit=1Byte. 줄여서 B라고 쓴다. 항상 대문자로 써야 하고, 소문자(b)는 비트를 의미한다.

ASCII 코드를 이용해 영어권 문자숫자, 그리고 몇 가지 기호를 나타내기 위해 필요한 비트 수는 7개이다. 그래서 7비트를 1바이트로 구성하는 경우도 있었으나, 8비트를 1바이트로 한 구성이 다루기가 편해 8비트가 사용되는 것. 이 때문에 1 캐릭터(character)라는 단위로 부르기도 한다. 한 문자라는 뜻이다. 비영어권 문자는 2바이트 이상이 사용되기도 하지만.

SI 접두어의 사용[편집 | 원본 편집]

바이트 앞에 SI 접두어를 사용해 기억장치의 용량이나 정보량을 나타내는데, KB(킬로바이트), MB(메가바이트), GB(기가바이트) 등이다. 보통의 SI 접두어는 103, 106과 같이 10의 거듭제곱을 나타내지만 정보량에서는 그 의미가 달라, 210, 220과 같이 2의 거듭제곱을 나타낸다. 10의 제곱은 1000, 2의 10제곱이 1024으로 거의 비슷해 SI접두어를 가져다 사용해도 괜찮을 것으로 보였으나, 하드디스크 제조사 등에서 이 SI 접두어를 원 의미대로 사용해 1000, 1000000으로 끊어놓고는 몇 GB니 하며 표기하게 되었다. 1킬로바이트 수준의 1024와 1000의 차이는 24바이트로 크지 않아 보이지만, 메가 단위로 가면 이 차이는 48576바이트가 되고, 기가 수준이 되면 73,741,824바이트(=70.33MB)라는 큰 차이가 된다. 이걸 모르고 하드를 구입하게 되면 1TB(1012byte) 하드디스크를 설치했는데 931.3GB로 표시되는 하드디스크가 불량이라고 생각할 수 있다. 즉, 원래 용량보다 커보이게 하려는 꼼수인 것.

이런 문제점을 해결하기 위해 이진 접두어를 사용하기도 한다. KB대신 KiB(키비바이트)를, GB대신 GiB(기비바이트)등을 사용해 원래 사용되던 2의 거듭제곱을 나타낸다. 이러면 1TB(1012바이트) HDD는 컴퓨터에서는 931.3GiB 으로 표시된다 하지만 쓰는 사람이 없다. 거의 모든 리눅스 배포판에서는 이진 접두어를 정확하게 사용하고 있다.

상기 언급한 디스크별 저장량 차이값에 대해서는 아래 표 참고.

저장매체 표기값

(기본형)

실제값 표기값

(확장형)

실제값
Blu-ray 25GB

(25,025,314,816 Byte)

23.3GB

(23866MB)

50GB(DL)

(50,050,629,632 Byte)

46.6GB

(47732MB)

DVD(-R) 4.7GB

(4,707,319,808 Byte)

4.38GB

(4484MB)

8.5GB(-R DL)

(8,543,666,176 Byte)

7.98GB(-R DL)

(8147MB)

CD 700MB 870MB

한편, 비트(b)의 경우는 SI 접두어가 정확히 10의 거듭제곱의 의미로만 쓰인다. 1 Kb = 1,000 b이고, 1 Mb = 1,000,000 b이다.