번역 생성

curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"

{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

개요

지원되는 모든 언어의 오디오를 영어 텍스트로 번역합니다. transcription과 달리, 이 endpoint는 입력 언어와 관계없이 항상 영어 텍스트를 출력합니다.

요청 본문

file

필수

번역할 오디오 파일입니다. 지원 형식: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. 최대 파일 크기는 25 MB입니다.

model

string

기본값:"whisper-1"

사용할 model입니다. 현재는 whisper-1만 지원됩니다.

prompt

string

model의 스타일을 유도하거나 이전 세그먼트를 이어가기 위한 선택적 텍스트입니다. 영어로 작성해야 합니다.

response_format

string

기본값:"json"

출력 형식입니다. 옵션: json, text, srt, verbose_json, vtt.

temperature

number

0과 1 사이의 sampling temperature입니다. 0.8과 같은 높은 값은 더 무작위적인 출력을 생성하고, 0.2와 같은 낮은 값은 출력을 더 집중되고 결정적으로 만듭니다.

응답

text

string

영어로 번역된 텍스트입니다.

verbose_json 형식의 경우, 응답에는 다음도 포함됩니다:

language

string

입력 오디오에서 감지된 언어입니다.

duration

number

초 단위의 입력 오디오 길이입니다.

segments

array

타임스탬프가 포함된 번역 텍스트 세그먼트입니다.

curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"

{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

번역 vs 전사

기능	번역	전사
출력 언어	항상 영어	입력과 동일
사용 사례	외국어 오디오를 영어로 변환	원본 언어 유지
Language parameter	해당 없음	선택적 힌트

번역 endpoint는 원본 언어를 자동으로 감지하고 영어로 번역합니다. transcription의 language parameter는 무시됩니다.

전사 생성 음악 생성

핵심

텍스트

파일 및 배치

이미지 및 미디어

비동기 작업

Gemini 네이티브

관리

개요

요청 본문

응답

번역 vs 전사

핵심

텍스트

파일 및 배치

이미지 및 미디어

비동기 작업

Gemini 네이티브

관리

​개요

​요청 본문

​응답

​번역 vs 전사

개요

요청 본문

응답

번역 vs 전사