UTAU/음원 형식

< UTAU

음원 구조에 따른 분류[편집 | 원본 편집]

단독음[편집 | 원본 편집]

UTAU 음원 형식 단독음.jpg


단음/단독음. 영어권에선 자음(consonant)과 모음(vowel)의 앞글자를 따와 CV라고 부른다.

'글자 그대로 발음 하나하나를 단독으로 녹음한 음원.' 가장 널리 알려져 있고 사용도 쉬운 음원 형식이다.

  • 녹음과 재녹음, 음원 수정이 용이하다.
  • 원음수나 용량이 적다.
  • 조교하기가 편리하여 초보자들도 큰 무리 없이 사용할 수 있다.
  • 음절 단위별로 조교가 가능하여 세세한 조교가 용이하다.
  • 원음설정도 쉽고, 음원수정 후 oto.ini파일의 재작성이나 frq파일의 갱신이 빨리 이루어진다.
  • 음과 음 사이의 연결에 위화감이 느껴지며, 발성 방식이 딱딱한 경우가 많다.
  • 한 음원을 이용하여 조교한 것을 다른 음원으로 유사한 효과를 내기 위해서 수정절차가 많다. 그리고 연속음 대응으로 제작된 ust를 돌리려면 엔벨로프 조교를 처음부터 싹 뜯어고쳐야 한다.
  • 영어의 ay. ey, oy 같은 하강 이중모음은 단독음으로 구현하기 힘들다. 일본어에 특화된 음원 형식.

연속음[편집 | 원본 편집]

UTAU 음원 형식 연속음.jpg


연속음은 말그대로 연속하는 음 5~8개를 묶어서 녹음하여 발음 사이사이에 있는 연음을 자연스럽게 해주는 음원이다.

ex) [う][た][い][ま][す]->[- う][u た][a い][i ま][a す]

보컬로이드 녹음도 이와 비슷하게 녹음되어진다고 한다.

단음보다 자연스러우나 원음설정이 없으면 사용하지 못하는 것이 흠이다.

최초의 연속음 음원발표음원은 모모네 모모 이것으로 UTAU는 보컬로이드와 싸울 수 있게 되었다

  • 녹음에 시간이 오래 걸리고 재녹음이나 음원 수정을 했을 시 함께 녹음한 다른 발음들도 죄다 다시 설정해야 하므로 번거롭다.
  • 원음수가 단독음에 비하여 많고 원음설정창의 엔트리 수는 스크롤의 압박을 느끼기에 충분하다.
  • 일반적으로 용량을 가장 많이 차지하는 형식이다.
  • 초보자들은 조교하는 데에 어려움을 느낄 수 있다.(특히 엔벨로프 조교는 별도의 플러그인 사용하지 않으면 노가다의 결정체)
  • 피치선의 분포나 파형을 참고한다면 원음설정 자체는 고도의 기술을 요하지 않으나 작업할 분량이 많고, frq파일의 생성에 시간이 매우 많이 걸리므로 처음 설정시에는 인내심과 근성이 굉장히 많이 필요하다.
  • 음과 음 사이의 연결이 매끄럽고, 발음도 훨씬 자연스럽고 부드럽다.
  • 크로스페이드(모음과 모음 사이의 합성부분) 부분에 위화감이 느껴질 수 있다. 이 때문에 일관된 음색으로 녹음하는 것이 중요하다.
  • 그 외에도 녹음 상의 대단한 핸디캡이 바로 자음부의 처리, 보통 발성하듯이 하면 연결이 매끄럽지 못해 의식적으로 부드럽게 이어서 발음해야 하는데(히비키 신지처럼 음절 사이의 연결이 거칠도록 의도된 경우는 제외하고), 이 때문에 단독음에 비하여 음절 사이의 구분이 조금 뚜렷하지 못한 경향이 있다.
  • 조교를 하지 않아도 상당히 자연스러운 발성을 보여준다.
  • 플러그인 하나만 돌리면 연속음 대응으로 제작된 ust는 따로 수정할 필요가 없으며, 단독음 대응으로 제작된 ust도 특별히 무리 없이 소화 가능하다.(이 때 엔벨로프 정보가 상당수 사라지는데, 단독음상의 엔벨로프는 음절 사이의 자연스러운 연결을 위한 경우가 많으므로 크게 괘념치 않아도 된다. 만약 창법에 관한 정보라면 보존하는 데에 세심한 절차가 필요하다. 그래도 연속음용 ust를 단독음음원으로 커버하는 것보다는 수월하다.)

연속음 리스트의 종류[편집 | 원본 편집]

연속음 리스트에는 크게 두가지 방식이 있다. 단독음원과 혼용하여 쓰는 병행식과 연속음만으로 사용가능한 완결식 두 가지로, 모두 각각 장단점이 있으니 잘 살펴보고 좋아보이는 방식으로 녹음하면 된다.

연속음은 한 파일당 발음하는 발음 수가 많을수록 녹음할 파일의 양은 줄어들지만 그만큼 녹음 난이도가 올라가기때문에 자신의 폐활량 등을 고려해보고 리스트를 선택하면 된다. 리스트 이름의 ○○식○음리스트 에서 ○○식은 리스트 제작자의 이름, ○음은 한 파일당 발음되는 발음 수를 나타낸다.

병행식
최초의 연속음인 모모네 모모를 포함한 카사네 테토, 보우네 리아트 등이 이 방식을 사용하고 있다.
  • 장점
    단독음과 병행하여 사용하기 때문에 완결식에 비해 녹음수 및 원음 설정 수가 비교적 적다.
  • 단점
    보통 단독음을 완성하고 연속음을 만드는데, 단독음 때와 음색이 달라져 위화감이 생길 수 있다.
병행식을 채용하고 있는 연속음 리스트
  • 귀로보P식 5음 리스트 - UTAU 음원 녹음 전용 프로그램인 OREMO 안에 내장
이 이외에도 카사네 테토 등은 기존 리스트에서 부족한 발음을 추가해서 만든 자작 리스트를 사용하지만 별도로 리스트를 배포하고 있지는 않다. 병행식 리스트에 관심이 있으면 참고하면 좋다.
완결식
나미네 리츠, 하루카 나나, 셋카 유후, 인디고네 펭등이 이 방식을 채용했다.
  • 장점
    한 번에 녹음하기 때문에 음색이나 음질 면에서 비교적 안정적이다
  • 단점
    병행식에 비해 녹음할 음원과 원음설정의 수가 많다.
완결식을 채용하고있는 연속음 리스트

연속음풍 단독음[편집 | 원본 편집]

UTAU 음원 형식 단독음.jpg


  • 연속적인 발성을 이용하였다는 점에서는 연속음과 유사하나, 이를 음절 단위 별로 쪼갠다는 점에서 보여지는 음원 형식은 단독음이라 봐도 무방하다.
  • 녹음이나 재녹음, 음원 수정의 용의성은 연속음과 유사하지만, 원음수가 현저하게 적다는 점에서 전반적으로 훨씬 덜 번거롭다.
  • 원음 수나 용량은 단독음 음원과 동일하거나 유사하다. 짧게 끊어 발음하는 단독음 음원보다는 크고 길게 끌어 발음하는 단독음 음원보다는 작다.
  • 조교법은 단독음과 동일하다.
  • 원음설정 과정은 단독음 음원보다 살짝 복잡하나, 몇 번만 해보면 요령이 붙어 크게 개의치 않을 정도. 그 외 관련 사항은 단독음 음원과 다를 게 없다.
  • 음과 음 사이의 연결은 단독음보다는 매끄럽고 연속음보다는 위화감이 느껴진다.
  • 연속음 음원에서 발생할 수 있는 모음-모음 연결부위의 위화감이 없다.
  • 발음/발성 방식은 당연히 연속음과 동일하다.
  • 사용을 위해 단독음음원과 비교, 별도의 수정작업이 필요하지 않다.

연단술[편집 | 원본 편집]

UTAU 음원 형식 연단술.jpg


  • 코히가시가 고안해 낸 음원 형식. 기본적으로는 연단음과 발상이 유사하다. 고안해낸 사람의 글에 따르면 "연단음의 방식에, 발성 유형을 두 가지로 나누고, 음량을 조절하는 과정이 추가되었다."고 한다. 그렇다고 연단음에서 파생된 것은 아니다. 보기로는 연단음에서 좀더 보완한 것 같지만 태생적으로는 그렇지 않다.
  • 발성 유형을 두 가지로 나눈다는 의미는, 발성을 할 때 구절의 첫머리에 나오는 경우와 중간에 나오는 경우의 발음(특히 자음부)이 미묘하게 다르다. 어두에 올 때에는 숨 성분이 많이 섞여 나오고 어중에는 숨 성분은 거의 없고 음성 성분이 강조된다.
  • 마지막에 음량 조절에 관한 항목은 직접 툴킷이나 해당 형식의 음원을 참고하면 이해가 빠를 것이다. 제작자의 블로그의 내용을 번역하자면 "실제로 발음해보면 알겠지만 "아"와 "이", "오"와 "응"의 음량이 같아질 이유가 없지요." 라는 설명이 있다.
  • 원음수와 용량은 단독음 음원이나 연단음 음원보다는 크다.
  • 사용상의 특징은 구절의 첫머리에 올 경우에는 "- (발음)", 중간에 올 경우에는 "(발음)"을 이용하며, 연속음 일괄 설정 플러그인의 "단독음"과 "- 이 붙어있는 발음을 우선시한다"를 체크하면 손쉽게 가능하다.
  • (2012년 기준)준수한 퀄리티와 합리적인 용량으로 최근에 핫했던 음원 형식. 2019 기준으로는 상당히 시들해졌다.

CV-VC[편집 | 원본 편집]

UTAU 음원 형식 CV-VC.jpg


VC, 즉 모음과 다음 자음을 연결한 원음을 추가하여 음절 사이의 자연스러운 연결을 유도하는 방식이다. 단독음 형식으로 발음하고 VC계열을 위한 연속음식 음원을 추가하는 경우와, 처음부터 연속음 형식으로 녹음한 후 CV형식의 원음과 VC 형식의 원음을 따로 저장하고나 설정하는 경우가 있다.

  • 원음수나 용량은 음원별로 다른 듯하다.
  • 조교할 때 크로스페이드에 의한 엔벨로프 꼬임 현상을 주의해야한다.
  • VC에 해당하는 음표를 이용하면 음의 끄트머리의 피치조절 등 세세한 조교가 용이해진다. 다만 플래그나 바이브레이션, 엔벨로프 등을 적용할 때 분리되어 있는 CV음원과 VC 음원을 동시에 생각해야 하는 단점이 있을 수 있다.
  • 원음설정이 상당히 번거롭다. 특히 VC의 발음수는 CV의 발음수와 거의 동일하기 때문에 원음설정을 단독음의 두 배를 하는 꼴. 또 VC원음의 원음설정이 쉽지 않아 시행착오를 많이 겪게 된다.
  • 음과 음 사이의 연결은 단독음에 비하면 많이 매끄럽다. 훌륭한 음원이나 숙련된 사용자의 경우 연단음보다 자연스러운 연결이 가능하다.
  • 연속음과 비해서는 음절 사이의 연결은 매끄럽지 못할 수 있으나 음절 사이의 구분이 뚜렷하다.
  • 다른 형식의 음원들과 상호호환성이 굉장히 나쁘다. 다시 말해, 단독음 ust를 이용할 시, 각 연결부마다 VC부분에 해당하는 음표를 추가해주어야 하는데, 이 과정이 상당히 번거롭다. 연속음 ust는 단독음 형식의 ust로 변환하고 다시 CV-VC용 추가음표를 넣어야 하니 더더욱 손이 많이 간다.
  • 영어 등의 언어권은 발음 구현을 위해 강제로 CV-VC음원 형식을 택할 수 밖에 없다. 한국어에서 받침 발음을 구현하는데 사용된다.

VCCV[편집 | 원본 편집]

UTAU 음원 형식 VCCV.jpg

I sing for you[aɪ sɪŋ fər juː]를 vccv로 구현한 사진

  • Painted CZ가 고안해낸 CVVC의 발전형인 음원 형식. 영어게르만어에 특화되어있다.
  • apply[əˈplaɪ]처럼 모음-자음-자음-모음 형식의 발음을 구현 가능하기에 VCCV라 이름이 붙혀진 것으로 추정된다.
  • 녹음량이 매우 많고 복잡하지만 영어를 비롯한 외국어를 높은 퀄로 구현해낼 수 있는 유일한 음원형식이기 때문에 외국어를 도전하는 사람들에겐 거의 반강제된다.
  • 단점은 낮은 ust 호환성, 원음설정의 복잡함 등으로 CVVC와 거의 똑같다.

다음계[편집 | 원본 편집]

높낮이가 다른 wav파일이 있는 음원. 예를 들면 あ↑나 あ↓가 있는 식이다.

다음계 음원을 보완하기 위해 생긴 것이 prefix.map 파일이다.

UTAU 음원 형식 다음계 prefix 1.png


만약 음원이 あhigh(G4)가 있고 그냥 あ(C4)가 있는 식이라면 suffix에 high를 넣고 G4 이상의 키를 전부 선택하여


UTAU 음원 형식 다음계 prefix 2.png


이런 식으로 만든다. 이렇게 되면 G4 이상의 노트를 입력하면 자동으로 high가 붙은 음원을 인식하게 된다.

대표적인 예로는 나미네 리츠 키레가 있는데 마치 사람이 부르는 듯한 목소리를 들을 수 있다.

나미네 리츠 키레 음원으로 커버한 "ERROR"를 들으면 바로 어떤 느낌인지 알 수 있을 것이다. 그 외에 저음 등 음원의 부족한 부분을 메꿔줄 수도 있다.

조교나 노래에 따라 오히려 역효과를 내기도 있다. 지르지 말아야 할 부분에서 지르거나 고음 음계와 저음 음계의 갭이 심각하게 커져서 듣기 거슬려진다.

보통은 저음 음원을 고음에 적용시키는 것보다 고음 음원을 저음에 적용시키는 것이 위화감이 커서 듣기 거슬리는데 고음 음원의 모음부가 저음 모음부와 크로스페이드 된 것이 원인이다. 갑자기 저음에서 확 올라가는 고음은 저음 음계나 CVVC로 처리해보자.

음색에 따른 분류[편집 | 원본 편집]

음원 형식(음색에 따른 분류). 통상 음원 외의 음원은 어펜드로서 Whisper, Solid등 독특한 이름을 붙이기도 한다.

통상음원
가장 기본적인 음원. 강하다고 부르기도 약하다고 부르기도 애매한 음원이 주로 여기에 속한다. 다만 통상의 기준이 애매하여, 강음원이나 약음원이 통상음원인 경우도 많다. 붙이기 나름인 것.
강음원
강한 진성으로 녹음된 음원. 시원하게 올라가는 고음이 특징이다. 예로는 나미네 리츠 강음원, 국내 음원인 소라네 유이가 있다.
약음원
말그대로 부드럽고 연한 음원.
가성과는 약간 다르다. 가성은 고음역대를 커버하기 위한 두성을 주로 가리키는 반면, 약음원은 가성부터 숨소리가 섞인 허스키 보이스까지 두루 가리킨다.
엣지 음원
보컬 프라이(Vocal Fry) 음원. 목에 힘을 줘서 신음 소리처럼 내뱉어 발성한다. 보통 모음만 있는 경우가 대부분이다.

캐릭터 설정에 따른 분류[편집 | 원본 편집]

남성 음원
UTAU 캐릭터 성별이 남성인 음원. 보통은 남성 성우가 녹음한 중저음의 굵은 음원을 가리키나 여성 성우가 녹음하거나 얇은 목소리를 가지는 경우 역시 많다.
소년 음원
UTAU 캐릭터 설정인 소년인 음원. 보통은 여성 음원보다는 굵고 남성 음원보다는 얇은 음원인 경우가 많다.
여성 음원
UTAU 캐릭터 성별이 여성인 음원. 보통은 여성 성우가 녹음한 중고음의 얇은 음원을 가리키나 남성 성우가 녹음하거나 굵은 목소리를 가지는 경우 역시 많다.
소녀 음원
UTAU 캐릭터 설정인 소녀인 음원. 보통은 여성 음원보다도 아주 얇은 고음인 경우가 많다.
특수 성별 음원
'성별 불명', '키메라', '만져보면 안다' 등으로 일부러 설명을 어물쩡 넘기거나 공식적으로 무성, 중성, 양성, 제3의 성 등을 지향하는 음원.
보통 소년 음원과 여성 음원 정도의 음원들이 여기에 속한다. 굵은 중저음의 성별 불명 UTAU는 무척 보기 힘든 편이다.

각주