Tạo bản chép lời

curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"

{
  "text": "Hello, this is a test of the transcription API."
}

Nội dung Request

file

bắt buộc

Tệp audio cần chép lời. Các định dạng được hỗ trợ: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.

model

string

mặc định:"whisper-1"

Model sẽ sử dụng. Hiện tại chỉ hỗ trợ whisper-1.

language

string

Ngôn ngữ của audio theo định dạng ISO-639-1 (ví dụ: en, zh, ja).

prompt

string

Văn bản tùy chọn để định hướng phong cách của model hoặc tiếp tục một đoạn trước đó.

response_format

string

mặc định:"json"

Định dạng đầu ra: json, text, srt, verbose_json, vtt.

temperature

number

mặc định:"0"

Nhiệt độ lấy mẫu (0 đến 1).

timestamp_granularities

array

Độ chi tiết của dấu thời gian: word và/hoặc segment. Yêu cầu verbose_json.

Response

text

string

Văn bản đã được chép lời.

Đối với verbose_json:

task

string

Luôn là transcribe.

language

string

Ngôn ngữ được phát hiện.

duration

number

Thời lượng audio tính bằng giây.

segments

array

Các đoạn chép lời kèm dấu thời gian.

words

array

Dấu thời gian ở cấp độ từ (nếu được yêu cầu).

curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"

{
  "text": "Hello, this is a test of the transcription API."
}

Dịch

Để dịch audio sang tiếng Anh, hãy sử dụng endpoint translations:

response = client.audio.translations.create(
    model="whisper-1",
    file=audio_file
)

Tạo Giọng nói Tạo Bản dịch

Cốt lõi

Văn bản

Tệp và lô

Hình ảnh và phương tiện

Tác vụ bất đồng bộ

Gemini gốc

Quản lý

Tạo bản chép lời

Nội dung Request

Response

Dịch

Cốt lõi

Văn bản

Tệp và lô

Hình ảnh và phương tiện

Tác vụ bất đồng bộ

Gemini gốc

Quản lý

​Nội dung Request

​Response

​Dịch

Nội dung Request

Response

Dịch