Ana içeriğe atla
POST
/
v1
/
audio
/
transcriptions
curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"
{
  "text": "Hello, this is a test of the transcription API."
}

İstek Gövdesi

file
file
gerekli
Metne dönüştürülecek ses dosyası. Desteklenen formatlar: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
model
string
varsayılan:"whisper-1"
Kullanılacak model. Şu anda yalnızca whisper-1 desteklenmektedir.
language
string
ISO-639-1 formatında sesin dili (örneğin, en, zh, ja).
prompt
string
Modelin stilini yönlendirmek veya önceki bir bölümü devam ettirmek için isteğe bağlı metin.
response_format
string
varsayılan:"json"
Çıktı formatı: json, text, srt, verbose_json, vtt.
temperature
number
varsayılan:"0"
Örnekleme sıcaklığı (0 ile 1 arası).
timestamp_granularities
array
Zaman damgası ayrıntı düzeyi: word ve/veya segment. verbose_json gerektirir.

Yanıt

text
string
Metne dönüştürülen metin.
verbose_json için:
task
string
Her zaman transcribe.
language
string
Algılanan dil.
duration
number
Saniye cinsinden ses süresi.
segments
array
Zaman damgalı transkripsiyon bölümleri.
words
array
Kelime düzeyinde zaman damgaları (istenirse).
curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"
{
  "text": "Hello, this is a test of the transcription API."
}

Çeviri

Sesi İngilizceye çevirmek için translations uç noktasını kullanın:
response = client.audio.translations.create(
    model="whisper-1",
    file=audio_file
)