Ana içeriğe atla

Genel Bakış

Desteklenen herhangi bir dildeki sesi İngilizce metne çevirir. Transkripsiyondan farklı olarak, bu endpoint girdi dilinden bağımsız olarak her zaman İngilizce metin çıktısı üretir.

İstek Gövdesi

file
file
gerekli
Çevrilecek ses dosyası. Desteklenen formatlar: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. Maksimum dosya boyutu 25 MB’dir.
model
string
varsayılan:"whisper-1"
Kullanılacak model. Şu anda yalnızca whisper-1 desteklenmektedir.
prompt
string
Modelin stilini yönlendirmek veya önceki bir segmenti devam ettirmek için isteğe bağlı bir metin. İngilizce olmalıdır.
response_format
string
varsayılan:"json"
Çıktının formatı. Seçenekler: json, text, srt, verbose_json, vtt.
temperature
number
0 ile 1 arasında örnekleme temperature değeri. 0.8 gibi daha yüksek değerler daha rastgele çıktı üretirken, 0.2 gibi daha düşük değerler çıktıyı daha odaklı ve deterministik hale getirir.

Yanıt

text
string
İngilizceye çevrilmiş metin.
verbose_json formatı için, yanıt ayrıca şunları içerir:
language
string
Girdi sesinin algılanan dili.
duration
number
Girdi sesinin saniye cinsinden süresi.
segments
array
Zaman damgalarıyla birlikte çevrilmiş metin segmentleri.
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Çeviri vs Transkripsiyon

ÖzellikÇeviriTranskripsiyon
Çıktı diliHer zaman İngilizceGirdi ile aynı
Kullanım durumuYabancı dildeki sesi İngilizceye dönüştürmeOrijinal dili koruma
Dil parametresiUygulanamazİsteğe bağlı ipucu
Çeviri endpoint’i kaynak dili otomatik olarak algılar ve İngilizceye çevirir. Transkripsiyondaki language parametresi yok sayılır.