语音合成 (Text to Audio)

高质量语音合成接口,支持多种音色、语速调节和情感表达。适用于有声读物、语音助手等场景。

API 端点

POST/t2a_v2

文本转语音

请求参数

参数名类型必填说明
modelstring必填模型名称:speech-2.6-hd 或 speech-2.6-turbo
textstring必填要合成的文本内容
voice_idstring可选音色 ID,使用预设音色或克隆音色
speednumber可选语速,范围 0.5-2.0,默认 1.0
pitchnumber可选音调,范围 -12 到 12
audio_formatstring可选输出格式:mp3, wav, pcm

请求示例

请求示例
{
  "model": "speech-2.6-hd",
  "text": "你好,欢迎使用 MiniMax 语音合成服务。",
  "voice_id": "female-tianmei",
  "speed": 1.0,
  "audio_format": "mp3"
}

响应示例

响应示例
{
  "audio": "base64_encoded_audio_data...",
  "status": "success",
  "usage": {
    "characters": 18
  }
}

代码示例

import requests
import base64

url = "https://your-proxy-domain.com/v1/t2a_v2"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}
data = {
    "model": "speech-2.6-hd",
    "text": "你好,欢迎使用 MiniMax 语音合成服务。",
    "voice_id": "female-tianmei",
    "speed": 1.0,
    "audio_format": "mp3"
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

# 保存音频文件
audio_data = base64.b64decode(result["audio"])
with open("output.mp3", "wb") as f:
    f.write(audio_data)