جسم الطلب
ملف الصوت المراد تفريغه. التنسيقات المدعومة: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
النموذج المراد استخدامه. حاليًا لا يتم دعم سوى
whisper-1.لغة الصوت بتنسيق ISO-639-1 (على سبيل المثال:
en, zh, ja).نص اختياري لتوجيه أسلوب النموذج أو متابعة مقطع سابق.
تنسيق الإخراج:
json, text, srt, verbose_json, vtt.درجة حرارة أخذ العينات (من 0 إلى 1).
دقة الطابع الزمني:
word و/أو segment. يتطلب verbose_json.الاستجابة
النص المُفرَّغ.
verbose_json:
تكون دائمًا
transcribe.اللغة المكتشفة.
مدة الصوت بالثواني.
مقاطع التفريغ مع الطوابع الزمنية.
طوابع زمنية على مستوى الكلمات (إذا تم طلبها).