İstek Gövdesi
Transkribe edilecek ses dosyası. Desteklenen formatlar: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
Kullanılacak model. Şu anda yalnızca
whisper-1 desteklenmektedir.Sesin dili, ISO-639-1 formatında (ör.
en, zh, ja).Modelin stilini yönlendirmek veya önceki bir segmenti devam ettirmek için isteğe bağlı metin.
Çıktı formatı:
json, text, srt, verbose_json, vtt.Örnekleme temperature değeri (0 ile 1 arası).
Zaman damgası ayrıntı düzeyi:
word ve/veya segment. verbose_json gerektirir.Yanıt
Transkribe edilen metin.
verbose_json için:
Her zaman
transcribe.Algılanan dil.
Ses süresi, saniye cinsinden.
Zaman damgalarıyla birlikte transkripsiyon segmentleri.
Kelime düzeyinde zaman damgaları (istenirse).