Chuyển đến nội dung chính

Tổng quan

Dịch audio ở bất kỳ ngôn ngữ được hỗ trợ nào thành văn bản tiếng Anh. Không giống như transcription, endpoint này luôn trả về văn bản tiếng Anh bất kể ngôn ngữ đầu vào là gì.

Nội dung yêu cầu

file
file
bắt buộc
Tệp audio cần dịch. Các định dạng được hỗ trợ: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. Kích thước tệp tối đa là 25 MB.
model
string
mặc định:"whisper-1"
Model sẽ được sử dụng. Hiện tại chỉ hỗ trợ whisper-1.
prompt
string
Văn bản tùy chọn để định hướng phong cách của model hoặc tiếp tục một đoạn trước đó. Nên là tiếng Anh.
response_format
string
mặc định:"json"
Định dạng của đầu ra. Các tùy chọn: json, text, srt, verbose_json, vtt.
temperature
number
Nhiệt độ lấy mẫu, trong khoảng từ 0 đến 1. Các giá trị cao hơn như 0.8 tạo ra đầu ra ngẫu nhiên hơn, trong khi các giá trị thấp hơn như 0.2 khiến đầu ra tập trung và mang tính xác định hơn.

Phản hồi

text
string
Văn bản đã dịch bằng tiếng Anh.
Đối với định dạng verbose_json, phản hồi cũng bao gồm:
language
string
Ngôn ngữ được phát hiện của audio đầu vào.
duration
number
Thời lượng của audio đầu vào tính bằng giây.
segments
array
Các đoạn của văn bản đã dịch kèm dấu thời gian.
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Dịch thuật so với Chuyển lời nói thành văn bản

Tính năngDịch thuậtTranscription
Ngôn ngữ đầu raLuôn là tiếng AnhGiống với đầu vào
Trường hợp sử dụngChuyển audio tiếng nước ngoài sang tiếng AnhGiữ nguyên ngôn ngữ gốc
Tham số ngôn ngữKhông áp dụngGợi ý tùy chọn
Endpoint dịch thuật tự động phát hiện ngôn ngữ nguồn và dịch sang tiếng Anh. Tham số language từ transcription sẽ bị bỏ qua.