音声合成（Text to Audio）

複数の音声トーン、速度調整、感情表現に対応した高品質な音声合成インターフェースです。オーディオブック、音声アシスタントなどに最適です。

APIエンドポイント

POST/t2a_v2

テキストから音声への変換

リクエストパラメータ

パラメータ	型	必須	説明
`model`	string	必須	モデル名：speech-2.6-hd または speech-2.6-turbo
`text`	string	必須	合成するテキスト内容
`voice_id`	string	任意	音声ID、プリセットまたはクローン音声を使用
`speed`	number	任意	話速、範囲0.5-2.0、デフォルト1.0
`pitch`	number	任意	ピッチ、範囲-12～12
`audio_format`	string	任意	出力形式：mp3、wav、pcm

リクエスト例

{
  "model": "speech-2.6-hd",
  "text": "你好，欢迎使用 MiniMax 语音合成服务。",
  "voice_id": "female-tianmei",
  "speed": 1.0,
  "audio_format": "mp3"
}

レスポンス例

{
  "audio": "base64_encoded_audio_data...",
  "status": "success",
  "usage": {
    "characters": 18
  }
}

コード例

import requests
import base64

url = "https://your-proxy-domain.com/v1/t2a_v2"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}
data = {
    "model": "speech-2.6-hd",
    "text": "你好，欢迎使用 MiniMax 语音合成服务。",
    "voice_id": "female-tianmei",
    "speed": 1.0,
    "audio_format": "mp3"
}

response = requests.post(url, headers=headers, json=data)
result = response.json()

# 保存音频文件
audio_data = base64.b64decode(result["audio"])
with open("output.mp3", "wb") as f:
    f.write(audio_data)