Ringkasan
Menerjemahkan audio dalam bahasa apa pun yang didukung ke dalam teks bahasa Inggris. Tidak seperti transcription, endpoint ini selalu menghasilkan teks bahasa Inggris terlepas dari bahasa input.Request Body
File audio yang akan diterjemahkan. Format yang didukung:
flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. Ukuran file maksimum adalah 25 MB.Model yang akan digunakan. Saat ini hanya
whisper-1 yang didukung.Teks opsional untuk memandu gaya model atau melanjutkan segmen sebelumnya. Harus dalam bahasa Inggris.
Format output. Opsi:
json, text, srt, verbose_json, vtt.Temperature sampling, antara 0 dan 1. Nilai yang lebih tinggi seperti 0.8 menghasilkan output yang lebih acak, sedangkan nilai yang lebih rendah seperti 0.2 membuat output lebih terfokus dan deterministik.
Response
Teks terjemahan dalam bahasa Inggris.
verbose_json, response juga mencakup:
Bahasa yang terdeteksi dari audio input.
Durasi audio input dalam detik.
Segmen dari teks terjemahan beserta timestamp.
Terjemahan vs Transcription
| Fitur | Terjemahan | Transcription |
|---|---|---|
| Bahasa output | Selalu bahasa Inggris | Sama seperti input |
| Kasus penggunaan | Mengonversi audio berbahasa asing ke bahasa Inggris | Mempertahankan bahasa asli |
| Parameter bahasa | Tidak berlaku | Petunjuk opsional |
Endpoint translation secara otomatis mendeteksi bahasa sumber dan menerjemahkannya ke bahasa Inggris. Parameter
language dari transcription diabaikan.