음성 클론 튜토리얼
텍스트 음성 변환의 세밀한 제어
음성 생성을 고급으로 제어
시작하기
정규화를 끄면 숫자·날짜·URL 읽기 안정성이 떨어질 수 있습니다. 최상의 결과를 위해 직접 처리하세요.
음소 제어
음소 제어로 단어나 글자의 발음을 정확히 지정할 수 있습니다. 현재 지원:
- CMU Arpabet(영어)
- 병음(중국어)
음소 제어 시 발음을 <|phoneme_start|>와 <|phoneme_end|>로 감싸세요. 각 태그에는 단어 또는 글자 하나만 넣습니다.
예시
표준(영): I am an engineer.
제어(영): I am an <|phoneme_start|>EH N JH AH N IH R<|phoneme_end|>.
표준: 我是一个工程师。
제어: 我是一个<|phoneme_start|>gong1<|phoneme_end|><|phoneme_start|>cheng2<|phoneme_end|><|phoneme_start|>shi1<|phoneme_end|>。
부언어
부언어 제어로 자연스러운 발화 요소와 쉼을 넣어 더 사람처럼 들리게 할 수 있습니다. 두 가지 유형이 있습니다.
머뭇거림·간투사
"um", "uh", "嗯", "啊" 같은 일반적인 간투사로 말의 리듬을 조절할 수 있습니다.
특수 효과
아래 특수 효과는 괄호로 추가할 수 있습니다.
| 효과 | 설명 | 최초 지원 | 단계 |
|---|---|---|---|
| (break) | 짧은 쉼 | V2 | 실험 |
| (long-break) | 긴 쉼 | V2 | 실험 |
| (breath) | 숨소리 | V2 | 실험 |
| (laugh) | 웃음 | V2 | 실험 |
| (cough) | 기침 | V2 | 실험 |
| (lip-smacking) | 입술 소리 | V2 | 실험 |
| (sigh) | 한숨 | V2 | 실험 |
(laugh), (cough), (lip-smacking), (sigh)는 개발 중입니다. 더 나은 결과를 위해 여러 번 반복해 보세요.
영어 예:
표준: I am an engineer.
부언어 포함: I am, um, an (break) engineer.
중국어 예:
표준: 我是一名工程师。
부언어 추가: 我,嗯,是一名(break)工程师。