메인 콘텐츠로 건너뛰기

개요

지원되는 모든 언어의 오디오를 영어 텍스트로 번역합니다. transcription과 달리, 이 endpoint는 입력 언어와 관계없이 항상 영어 텍스트를 출력합니다.

요청 본문

file
file
필수
번역할 오디오 파일입니다. 지원 형식: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. 최대 파일 크기는 25 MB입니다.
model
string
기본값:"whisper-1"
사용할 model입니다. 현재는 whisper-1만 지원됩니다.
prompt
string
model의 스타일을 유도하거나 이전 세그먼트를 이어가기 위한 선택적 텍스트입니다. 영어로 작성해야 합니다.
response_format
string
기본값:"json"
출력 형식입니다. 옵션: json, text, srt, verbose_json, vtt.
temperature
number
0과 1 사이의 sampling temperature입니다. 0.8과 같은 높은 값은 더 무작위적인 출력을 생성하고, 0.2와 같은 낮은 값은 출력을 더 집중되고 결정적으로 만듭니다.

응답

text
string
영어로 번역된 텍스트입니다.
verbose_json 형식의 경우, 응답에는 다음도 포함됩니다:
language
string
입력 오디오에서 감지된 언어입니다.
duration
number
초 단위의 입력 오디오 길이입니다.
segments
array
타임스탬프가 포함된 번역 텍스트 세그먼트입니다.
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

번역 vs 전사

기능번역전사
출력 언어항상 영어입력과 동일
사용 사례외국어 오디오를 영어로 변환원본 언어 유지
Language parameter해당 없음선택적 힌트
번역 endpoint는 원본 언어를 자동으로 감지하고 영어로 번역합니다. transcription의 language parameter는 무시됩니다.