요청 본문
전사할 오디오 파일입니다. 지원되는 형식: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
사용할 모델입니다. 현재 whisper-1만 지원됩니다.
ISO-639-1 형식의 오디오 언어입니다 (예: en, zh, ja).
모델의 스타일을 가이드하거나 이전 세그먼트를 이어가기 위한 선택적 텍스트입니다.
출력 형식: json, text, srt, verbose_json, vtt.
타임스탬프 세분화: word 및/또는 segment. verbose_json이 필요합니다.
verbose_json의 경우:
curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
-H "Authorization: Bearer sk-your-api-key" \
-F file="@audio.mp3" \
-F model="whisper-1" \
-F language="en"
{
"text": "Hello, this is a test of the transcription API."
}
오디오를 영어로 번역하려면 번역 엔드포인트를 사용하세요:
response = client.audio.translations.create(
model="whisper-1",
file=audio_file
)