Body Permintaan
File audio untuk ditranskripsikan. Format yang didukung: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
Model yang digunakan. Saat ini hanya
whisper-1 yang didukung.Bahasa audio dalam format ISO-639-1 (misalnya,
en, zh, ja).Teks opsional untuk memandu gaya model atau melanjutkan segmen sebelumnya.
Format output:
json, text, srt, verbose_json, vtt.Temperatur sampling (0 hingga 1).
Granularitas timestamp:
word dan/atau segment. Memerlukan verbose_json.Respons
Teks hasil transkripsi.
verbose_json:
Selalu
transcribe.Bahasa yang terdeteksi.
Durasi audio dalam detik.
Segmen transkripsi dengan timestamp.
Timestamp tingkat kata (jika diminta).