오디오 파일

(음원 파일에서 넘어옴)

오디오 파일(Audio file)은 디지털 오디오 데이터를 저장하기 위한 파일 형식이다. 음원 파일이라고도 한다.

분류[편집 | 원본 편집]

그림을 디지털 데이터화한 이미지 파일과 마찬가지로 아날로그 소리 데이터를 디지털화하는 것이다보니, 압축을 하지 않으면 대역폭이 급격히 올라가게 된다. 이 때문에 오디오 파일에서도 데이터 압축 기술은 널리 이용되고 있으며, 때문에 오디오 파일은 대부분 압축 여부와 압축 방식에 따라 분류가 이루어진다.

비압축[편집 | 원본 편집]

아날로그 음원을 샘플링(표본화)한 것을 그대로 저장하는 방식이다. 샘플링 레이트가 높으면 높을수록 대역폭 낭비가 심해지기 때문에 보통 저음질, 저용량 파일이나 간단히 작업물을 주고 받을 필요가 있는 경우에만 사용된다. wav 파일이 여기 속하며, PCM 원본(raw)를 직접 저장하는 경우도 있다.

손실 압축[편집 | 원본 편집]

아날로그 그림을 디지털화하여 저장하는 이미지 파일과 마찬가지로 오디오 파일 역시 인간의 청각 특성을 이용한 손실 압축이 가능하다. 특히 과거 단위 저장 용량당 비용이 높았을 시절에는 손실 압축은 상당히 효율적이었으므로, 자주 사용되었고 그게 지금까지 이어지고 있다. MPEG-4 레이어 3 (오디오)에 의해 정의된 mp3가 가장 대표적이며, 이 외에도 ogg (Vorbis), wma (손실 코덱) 등이 자주 사용되는 파일 포맷이다.

비손실 압축[편집 | 원본 편집]

비록 손실 압축이 인간의 청각 특성을 이용해 아주 적은 오차로 소리를 구현한다고 하지만, 규칙성 때문에 특정 패턴에는 특히 약해질 수밖에 없다. 또, 2010년대 안팎으로 저장 매체의 용량이 크게 늘어나고 가격이 낮아진 덕택에 접근성이 높아져 개인의 취향에 따라서도 비손실을 선호하는 경우가 많으므로, 비손실 압축 방식 역시 자주 사용되곤 한다. FLAC 등이 2010년대 이후 대표적으로 사용되는 비손실 압축 포맷이다.

특성[편집 | 원본 편집]

표본화 주기[편집 | 원본 편집]

보통 한자어보다 영어를 사용해 샘플링 레이트(Sampling rate)라고 부른다. 오디오, 즉 소리는 아날로그 데이터다. 디지털 오디오를 담고 있는 오디오 파일을 만들기 위해서는 디지털화, 즉 연속성이 있는 자료를 표본화(양자화)해야 한다. 이 과정에서 나오는 것이 샘플링이다. 샘플링 레이트는, 샘플링을 할 때의 주기/주파수를 담고 있는 것으로, 고음질에서는 CD에서 사용되는 44 KHz 내지 그 이상을, 보통 음질에서는 22 KHz 정도를 쓴다. 나이퀴스트-섀넌의 표본화 정리에 의해 샘플링 레이트의 반보다 낮은 주파수는 표현 불가능하며, 가청 영역대(~ 20 KHz)의 하위 20% 대역(~ 4 KHz)이 대부분의 소리를 구성하기 때문에 최저에서도 8 KHz (전화 음질) 정도를 사용하는게 보통이다.

샘플 깊이[편집 | 원본 편집]

깊이(Depth)는 특성 요소 중 하나지만 오디오 파일에서 크게 사용되지는 않는다. 오히려 대역폭을 많이 사용하는 편이다. 깊이는 양자화 정도를 나타내는 것으로, 오디오에서는 음파의 세기를 얼마나 자잘하게 나눌지를 결정한다. 16비트(bit) 정도로도 충분히 고음질을 만들어낼 수 있다.

채널[편집 | 원본 편집]

음성 채널의 갯수로, 모노(Mono, 단일 채널)와 스테레오(Stereo, L/R 채널, 인간의 귀 수만큼)가 많이 사용된다. 2010년대 안팎으로는 음장감 등을 중요시하는 경우가 생기면서 5.1 (6개 채널), 7.1 (8개 채널) 등의 다채널 방식도 사용된다.

대역폭[편집 | 원본 편집]

대역폭(Bandwidth)은 오디오 데이터의 시간당 자료량을 표현하는 것으로 일반적으로 음질을 나타내고자 할 때 많이 쓰인다. 대역폭은 표본화 주기와 샘플 깊이, 채널 수의 곱에 의해 결정되며, 압축 포맷은 여기에 압축률을 곱한다. 방송, 네트워크 등회선 혹은 무선을 사용하여 자료를 전송하는 경우에도 이 수치는 중요하게 쓰인다.

각주