Nội dung Request
Tệp audio cần chép lời. Các định dạng được hỗ trợ: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
Model sẽ sử dụng. Hiện tại chỉ hỗ trợ
whisper-1.Ngôn ngữ của audio theo định dạng ISO-639-1 (ví dụ:
en, zh, ja).Văn bản tùy chọn để định hướng phong cách của model hoặc tiếp tục một đoạn trước đó.
Định dạng đầu ra:
json, text, srt, verbose_json, vtt.Nhiệt độ lấy mẫu (0 đến 1).
Độ chi tiết của dấu thời gian:
word và/hoặc segment. Yêu cầu verbose_json.Response
Văn bản đã được chép lời.
verbose_json:
Luôn là
transcribe.Ngôn ngữ được phát hiện.
Thời lượng audio tính bằng giây.
Các đoạn chép lời kèm dấu thời gian.
Dấu thời gian ở cấp độ từ (nếu được yêu cầu).