音声合成(Text to Audio)
複数の音声トーン、速度調整、感情表現に対応した高品質な音声合成インターフェースです。オーディオブック、音声アシスタントなどに最適です。
APIエンドポイント
POST
/t2a_v2テキストから音声への変換
リクエストパラメータ
| パラメータ | 型 | 必須 | 説明 |
|---|---|---|---|
model | string | 必須 | モデル名:speech-2.6-hd または speech-2.6-turbo |
text | string | 必須 | 合成するテキスト内容 |
voice_id | string | 任意 | 音声ID、プリセットまたはクローン音声を使用 |
speed | number | 任意 | 話速、範囲0.5-2.0、デフォルト1.0 |
pitch | number | 任意 | ピッチ、範囲-12~12 |
audio_format | string | 任意 | 出力形式:mp3、wav、pcm |
リクエスト例
リクエスト例
{
"model": "speech-2.6-hd",
"text": "你好,欢迎使用 MiniMax 语音合成服务。",
"voice_id": "female-tianmei",
"speed": 1.0,
"audio_format": "mp3"
}レスポンス例
レスポンス例
{
"audio": "base64_encoded_audio_data...",
"status": "success",
"usage": {
"characters": 18
}
}コード例
import requests
import base64
url = "https://your-proxy-domain.com/v1/t2a_v2"
headers = {
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
}
data = {
"model": "speech-2.6-hd",
"text": "你好,欢迎使用 MiniMax 语音合成服务。",
"voice_id": "female-tianmei",
"speed": 1.0,
"audio_format": "mp3"
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
# 保存音频文件
audio_data = base64.b64decode(result["audio"])
with open("output.mp3", "wb") as f:
f.write(audio_data)