Ana içeriğe atla

İstek Gövdesi

file
file
gerekli
Transkribe edilecek ses dosyası. Desteklenen formatlar: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
model
string
varsayılan:"whisper-1"
Kullanılacak model. Şu anda yalnızca whisper-1 desteklenmektedir.
language
string
Sesin dili, ISO-639-1 formatında (ör. en, zh, ja).
prompt
string
Modelin stilini yönlendirmek veya önceki bir segmenti devam ettirmek için isteğe bağlı metin.
response_format
string
varsayılan:"json"
Çıktı formatı: json, text, srt, verbose_json, vtt.
temperature
number
varsayılan:"0"
Örnekleme temperature değeri (0 ile 1 arası).
timestamp_granularities
array
Zaman damgası ayrıntı düzeyi: word ve/veya segment. verbose_json gerektirir.

Yanıt

text
string
Transkribe edilen metin.
verbose_json için:
task
string
Her zaman transcribe.
language
string
Algılanan dil.
duration
number
Ses süresi, saniye cinsinden.
segments
array
Zaman damgalarıyla birlikte transkripsiyon segmentleri.
words
array
Kelime düzeyinde zaman damgaları (istenirse).
curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"
{
  "text": "Hello, this is a test of the transcription API."
}

Çeviri

Sesi İngilizceye çevirmek için translations endpoint’ini kullanın:
response = client.audio.translations.create(
    model="whisper-1",
    file=audio_file
)