Genel Bakış
Desteklenen herhangi bir dildeki sesi İngilizce metne çevirir. Transkripsiyondan farklı olarak, bu endpoint girdi dilinden bağımsız olarak her zaman İngilizce metin çıktısı üretir.İstek Gövdesi
Çevrilecek ses dosyası. Desteklenen formatlar:
flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. Maksimum dosya boyutu 25 MB’dir.Kullanılacak model. Şu anda yalnızca
whisper-1 desteklenmektedir.Modelin stilini yönlendirmek veya önceki bir segmenti devam ettirmek için isteğe bağlı bir metin. İngilizce olmalıdır.
Çıktının formatı. Seçenekler:
json, text, srt, verbose_json, vtt.0 ile 1 arasında örnekleme temperature değeri. 0.8 gibi daha yüksek değerler daha rastgele çıktı üretirken, 0.2 gibi daha düşük değerler çıktıyı daha odaklı ve deterministik hale getirir.
Yanıt
İngilizceye çevrilmiş metin.
verbose_json formatı için, yanıt ayrıca şunları içerir:
Girdi sesinin algılanan dili.
Girdi sesinin saniye cinsinden süresi.
Zaman damgalarıyla birlikte çevrilmiş metin segmentleri.
Çeviri vs Transkripsiyon
| Özellik | Çeviri | Transkripsiyon |
|---|---|---|
| Çıktı dili | Her zaman İngilizce | Girdi ile aynı |
| Kullanım durumu | Yabancı dildeki sesi İngilizceye dönüştürme | Orijinal dili koruma |
| Dil parametresi | Uygulanamaz | İsteğe bağlı ipucu |
Çeviri endpoint’i kaynak dili otomatik olarak algılar ve İngilizceye çevirir. Transkripsiyondaki
language parametresi yok sayılır.