İstek Gövdesi
Metne dönüştürülecek ses dosyası. Desteklenen formatlar: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
model
string
varsayılan:"whisper-1"
Kullanılacak model. Şu anda yalnızca whisper-1 desteklenmektedir.
ISO-639-1 formatında sesin dili (örneğin, en, zh, ja).
Modelin stilini yönlendirmek veya önceki bir bölümü devam ettirmek için isteğe bağlı metin.
Çıktı formatı: json, text, srt, verbose_json, vtt.
Örnekleme sıcaklığı (0 ile 1 arası).
Zaman damgası ayrıntı düzeyi: word ve/veya segment. verbose_json gerektirir.
Yanıt
Metne dönüştürülen metin.
verbose_json için:
Saniye cinsinden ses süresi.
Zaman damgalı transkripsiyon bölümleri.
Kelime düzeyinde zaman damgaları (istenirse).
curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
-H "Authorization: Bearer sk-your-api-key" \
-F file="@audio.mp3" \
-F model="whisper-1" \
-F language="en"
{
"text": "Hello, this is a test of the transcription API."
}
Çeviri
Sesi İngilizceye çevirmek için translations uç noktasını kullanın:
response = client.audio.translations.create(
model="whisper-1",
file=audio_file
)