음성 합성 (Text to Audio)
다양한 음색, 속도 조절 및 감정 표현을 지원하는 고품질 음성 합성 인터페이스입니다. 오디오북, 음성 비서 등에 적합합니다.
API 엔드포인트
POST
/t2a_v2텍스트 음성 변환
요청 파라미터
| 파라미터 | 타입 | 필수 | 설명 |
|---|---|---|---|
model | string | 필수 | 모델 이름: speech-2.6-hd 또는 speech-2.6-turbo |
text | string | 필수 | 합성할 텍스트 내용 |
voice_id | string | 선택 | 음성 ID, 프리셋 또는 복제된 음성 사용 |
speed | number | 선택 | 발화 속도, 범위 0.5-2.0, 기본값 1.0 |
pitch | number | 선택 | 음높이, 범위 -12~12 |
audio_format | string | 선택 | 출력 형식: mp3, wav, pcm |
요청 예시
요청 예시
{
"model": "speech-2.6-hd",
"text": "你好,欢迎使用 MiniMax 语音合成服务。",
"voice_id": "female-tianmei",
"speed": 1.0,
"audio_format": "mp3"
}응답 예시
응답 예시
{
"audio": "base64_encoded_audio_data...",
"status": "success",
"usage": {
"characters": 18
}
}코드 예시
import requests
import base64
url = "https://your-proxy-domain.com/v1/t2a_v2"
headers = {
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
}
data = {
"model": "speech-2.6-hd",
"text": "你好,欢迎使用 MiniMax 语音合成服务。",
"voice_id": "female-tianmei",
"speed": 1.0,
"audio_format": "mp3"
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
# 保存音频文件
audio_data = base64.b64decode(result["audio"])
with open("output.mp3", "wb") as f:
f.write(audio_data)