메인 콘텐츠로 건너뛰기
POST
/
v1
/
audio
/
translations
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

개요

지원되는 모든 언어의 오디오를 영어 텍스트로 번역합니다. 전사(transcription)와 달리, 이 엔드포인트는 입력 언어에 관계없이 항상 영어 텍스트를 출력합니다.

요청 본문

file
file
필수
번역할 오디오 파일입니다. 지원되는 형식: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. 최대 파일 크기는 25 MB입니다.
model
string
기본값:"whisper-1"
사용할 모델입니다. 현재 whisper-1만 지원됩니다.
prompt
string
모델의 스타일을 가이드하거나 이전 세그먼트를 이어가기 위한 선택적 텍스트입니다. 영어로 작성해야 합니다.
response_format
string
기본값:"json"
출력 형식입니다. 옵션: json, text, srt, verbose_json, vtt.
temperature
number
샘플링 온도로, 0에서 1 사이의 값입니다. 0.8과 같이 높은 값은 더 무작위한 출력을 생성하며, 0.2와 같이 낮은 값은 출력을 더 집중되고 결정론적으로 만듭니다.

응답

text
string
영어로 번역된 텍스트입니다.
verbose_json 형식의 경우, 응답에 다음 항목도 포함됩니다:
language
string
입력 오디오에서 감지된 언어입니다.
duration
number
입력 오디오의 길이(초)입니다.
segments
array
타임스탬프가 포함된 번역된 텍스트의 세그먼트들입니다.
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

번역 vs 전사

기능번역전사
출력 언어항상 영어입력과 동일
사용 사례외국어 오디오를 영어로 변환원본 언어 유지
언어 파라미터해당 없음선택적 힌트
번역 엔드포인트는 소스 언어를 자동으로 감지하고 영어로 번역합니다. 전사에서 사용되는 language 파라미터는 무시됩니다.