Chuyển đến nội dung chính

Documentation Index

Fetch the complete documentation index at: https://docs.lemondata.cc/llms.txt

Use this file to discover all available pages before exploring further.

Nội dung Request

Timeout cho yêu cầu đồng bộ: endpoint không phải chat này chờ model được định tuyến hoàn tất. Input lớn, audio dài, hoặc batch lớn có thể vượt quá mặc định 30s phổ biến của client, vì vậy hãy đặt timeout của HTTP client ít nhất là 120s.
file
file
bắt buộc
Tệp audio cần chép lời. Các định dạng được hỗ trợ: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
model
string
mặc định:"whisper-1"
Model sẽ sử dụng. Hiện tại chỉ hỗ trợ whisper-1.
language
string
Ngôn ngữ của audio theo định dạng ISO-639-1 (ví dụ: en, zh, ja).
prompt
string
Văn bản tùy chọn để định hướng phong cách của model hoặc tiếp tục một đoạn trước đó.
response_format
string
mặc định:"json"
Định dạng đầu ra: json, text, srt, verbose_json, vtt.
temperature
number
mặc định:"0"
Nhiệt độ lấy mẫu (0 đến 1).
timestamp_granularities
array
Độ chi tiết của dấu thời gian: word và/hoặc segment. Yêu cầu verbose_json.

Response

text
string
Văn bản đã được chép lời.
Đối với verbose_json:
task
string
Luôn là transcribe.
language
string
Ngôn ngữ được phát hiện.
duration
number
Thời lượng audio tính bằng giây.
segments
array
Các đoạn chép lời kèm dấu thời gian.
words
array
Dấu thời gian ở cấp độ từ (nếu được yêu cầu).
curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"
{
  "text": "Hello, this is a test of the transcription API."
}

Dịch

Để dịch audio sang tiếng Anh, hãy sử dụng endpoint translations:
response = client.audio.translations.create(
    model="whisper-1",
    file=audio_file
)