Contrôle fin de la synthèse vocale

Contrôle avancé de la génération vocale

Pour commencer

Sans normalisation, la lecture des chiffres, dates et URL peut être moins stable. Ajustez-les manuellement pour un meilleur rendu.

Contrôle des phonèmes

Le contrôle des phonèmes fixe la prononciation exacte. Prise en charge actuelle :

  • CMU Arpabet (anglais)
  • Pinyin (chinois)

Entourez la prononciation avec <|phoneme_start|> et <|phoneme_end|>. Chaque balise ne contient qu’un mot ou caractère.

Exemples

Standard : I am an engineer.

Avec contrôle : I am an <|phoneme_start|>EH N JH AH N IH R<|phoneme_end|>.

Standard (ZH) : 我是一个工程师。

Contrôle : 我是一个<|phoneme_start|>gong1<|phoneme_end|><|phoneme_start|>cheng2<|phoneme_end|><|phoneme_start|>shi1<|phoneme_end|>。

Paralangage

Le paralangage ajoute pauses et tics verbaux pour un rendu plus naturel. Deux familles principales :

Mots de remplissage

Utilisez « um », « uh », « 嗯 », « 啊 », etc. pour marquer le rythme.

Effets spéciaux

Ces effets s’ajoutent entre parenthèses :

EffetDescriptionPremière versionPhase
(break)Courte pauseV2Expérimental
(long-break)Longue pauseV2Expérimental
(breath)RespirationV2Expérimental
(laugh)RireV2Expérimental
(cough)TouxV2Expérimental
(lip-smacking)Bruit des lèvresV2Expérimental
(sigh)SoupirV2Expérimental

Les effets (laugh), (cough), (lip-smacking) et (sigh) évoluent ; répétez-les si besoin.

Exemple anglais :

Standard : I am an engineer.

Avec paralangage : I am, um, an (break) engineer.

Exemple chinois :

Standard : 我是一名工程师。

Avec paralangage : 我,嗯,是一名(break)工程师。