Chuyển đến nội dung chính

Nội dung Request

file
file
bắt buộc
Tệp audio cần chép lời. Các định dạng được hỗ trợ: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
model
string
mặc định:"whisper-1"
Model sẽ sử dụng. Hiện tại chỉ hỗ trợ whisper-1.
language
string
Ngôn ngữ của audio theo định dạng ISO-639-1 (ví dụ: en, zh, ja).
prompt
string
Văn bản tùy chọn để định hướng phong cách của model hoặc tiếp tục một đoạn trước đó.
response_format
string
mặc định:"json"
Định dạng đầu ra: json, text, srt, verbose_json, vtt.
temperature
number
mặc định:"0"
Nhiệt độ lấy mẫu (0 đến 1).
timestamp_granularities
array
Độ chi tiết của dấu thời gian: word và/hoặc segment. Yêu cầu verbose_json.

Response

text
string
Văn bản đã được chép lời.
Đối với verbose_json:
task
string
Luôn là transcribe.
language
string
Ngôn ngữ được phát hiện.
duration
number
Thời lượng audio tính bằng giây.
segments
array
Các đoạn chép lời kèm dấu thời gian.
words
array
Dấu thời gian ở cấp độ từ (nếu được yêu cầu).
curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"
{
  "text": "Hello, this is a test of the transcription API."
}

Dịch

Để dịch audio sang tiếng Anh, hãy sử dụng endpoint translations:
response = client.audio.translations.create(
    model="whisper-1",
    file=audio_file
)