Documentation Index
Fetch the complete documentation index at: https://docs.lemondata.cc/llms.txt
Use this file to discover all available pages before exploring further.
Nội dung Request
Timeout cho yêu cầu đồng bộ: endpoint không phải chat này chờ model được định tuyến hoàn tất. Input lớn, audio dài, hoặc batch lớn có thể vượt quá mặc định 30s phổ biến của client, vì vậy hãy đặt timeout của HTTP client ít nhất là120s.
Tệp audio cần chép lời. Các định dạng được hỗ trợ: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
Model sẽ sử dụng. Hiện tại chỉ hỗ trợ
whisper-1.Ngôn ngữ của audio theo định dạng ISO-639-1 (ví dụ:
en, zh, ja).Văn bản tùy chọn để định hướng phong cách của model hoặc tiếp tục một đoạn trước đó.
Định dạng đầu ra:
json, text, srt, verbose_json, vtt.Nhiệt độ lấy mẫu (0 đến 1).
Độ chi tiết của dấu thời gian:
word và/hoặc segment. Yêu cầu verbose_json.Response
Văn bản đã được chép lời.
verbose_json:
Luôn là
transcribe.Ngôn ngữ được phát hiện.
Thời lượng audio tính bằng giây.
Các đoạn chép lời kèm dấu thời gian.
Dấu thời gian ở cấp độ từ (nếu được yêu cầu).