語音合成

聲音克隆

對口型視頻

其他

語音合成 — HTTP v2

通過 HTTP 接口,使用音色 ID 與可選引擎參數合成語音。

語音合成(HTTP v2)

POST /api/open/v2/speech/tts。請求體為 JSON,包含待合成文本、音色 ID,以及可選的引擎與合成參數。鑑權使用 Authorization: Bearer,也可在 JSON 中附帶 token。

接口地址

POST /api/open/v2/speech/tts

請求頭

Content-Type
stringheader必填
application/json
Authorization
stringheader必填
Bearer <token> (API Key)

請求參數

application/json
voiceId
string必填
音色 ID。
modelId
string
引擎 ID。
可選項:fishaudio-s2profishaudio-s1minimax-2.8-turbominimax-2.8-hdminimax-2.6-turbominimax-2.6-hdqwen3-tts-flash
text
string必填
待合成文本。
format
string
輸出音頻格式。
可選項:mp3wav
speed
number
語速倍速(0.5-2.0)。
volume
number
輸出音量(-20~20)。
stability
number
穩定性/表現力(0.5-1.5;僅 Fish Audio 引擎支持)。
similarity
number
相似度(0.5-1.5;僅 Fish Audio 引擎支持)。
pitch
number
音調(半音,-12~12;僅 MiniMax / Qwen 引擎支持)。
language
string
語言提示/覆蓋。
emotion
string
說話情緒(僅 MiniMax 引擎支持)。
可選項:happysadangryfearfuldisgustedsurprisedcalm
token
string // 可選,已使用 Authorization: Bearer 時可省略
API token(已用 Authorization 時可省略)。

返回數據

// 成功響應 - 200
Content-Type: audio/mpeg (or audio/wav / audio/ogg depending on format)
<二進制音頻數據>

// 響應中可能包含與本次用量、剩餘額度相關的響應頭。

// 錯誤響應
{
  "code": string,
  "message": string,
  "requestId"?: string
}

CURL 示例

curl -X POST https://fishaudio.org/api/open/v2/speech/tts \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -d '{
    "voiceId": "00a1b221-6137-4b73-ad62-b0cbce134167",
    "modelId": "fishaudio-s2pro",
    "text": "Hello, world.",
    "format": "wav",
    "speed": 1,
    "volume": 0
  }' \
  --output output.wav

在線調試

狀態碼說明

狀態碼說明:
200 OK                  - 請求成功
400 Bad Request         - 請求參數錯誤
401 Unauthorized        - API Token 無效
403 Forbidden          - 禁止訪問
404 Not Found          - 資源不存在
413 Payload Too Large  - 上傳文件過大
429 Too Many Requests  - 請求頻率超限/積分不足
500 Server Error       - 服務器內部錯誤

錯誤響應格式:
{
  "error": string,      // 錯誤信息
  "details": string,    // 詳細錯誤信息(可選)
  "code": string       // 錯誤代碼(可選)
}