Langsung ke konten utama

Ringkasan

Menerjemahkan audio dalam bahasa apa pun yang didukung ke dalam teks bahasa Inggris. Tidak seperti transcription, endpoint ini selalu menghasilkan teks bahasa Inggris terlepas dari bahasa input.

Request Body

file
file
wajib
File audio yang akan diterjemahkan. Format yang didukung: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. Ukuran file maksimum adalah 25 MB.
model
string
default:"whisper-1"
Model yang akan digunakan. Saat ini hanya whisper-1 yang didukung.
prompt
string
Teks opsional untuk memandu gaya model atau melanjutkan segmen sebelumnya. Harus dalam bahasa Inggris.
response_format
string
default:"json"
Format output. Opsi: json, text, srt, verbose_json, vtt.
temperature
number
Temperature sampling, antara 0 dan 1. Nilai yang lebih tinggi seperti 0.8 menghasilkan output yang lebih acak, sedangkan nilai yang lebih rendah seperti 0.2 membuat output lebih terfokus dan deterministik.

Response

text
string
Teks terjemahan dalam bahasa Inggris.
Untuk format verbose_json, response juga mencakup:
language
string
Bahasa yang terdeteksi dari audio input.
duration
number
Durasi audio input dalam detik.
segments
array
Segmen dari teks terjemahan beserta timestamp.
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Terjemahan vs Transcription

FiturTerjemahanTranscription
Bahasa outputSelalu bahasa InggrisSama seperti input
Kasus penggunaanMengonversi audio berbahasa asing ke bahasa InggrisMempertahankan bahasa asli
Parameter bahasaTidak berlakuPetunjuk opsional
Endpoint translation secara otomatis mendeteksi bahasa sumber dan menerjemahkannya ke bahasa Inggris. Parameter language dari transcription diabaikan.