Langsung ke konten utama
POST
/
v1
/
audio
/
transcriptions
curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"
{
  "text": "Hello, this is a test of the transcription API."
}

Request Body

file
file
wajib
File audio untuk ditranskripsi. Format yang didukung: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
model
string
default:"whisper-1"
Model yang digunakan. Saat ini hanya whisper-1 yang didukung.
language
string
Bahasa audio dalam format ISO-639-1 (misalnya, en, zh, ja).
prompt
string
Teks opsional untuk memandu gaya model atau melanjutkan segmen sebelumnya.
response_format
string
default:"json"
Format output: json, text, srt, verbose_json, vtt.
temperature
number
default:"0"
Temperatur sampling (0 hingga 1).
timestamp_granularities
array
Granularitas timestamp: word dan/atau segment. Memerlukan verbose_json.

Respons

text
string
Teks hasil transkripsi.
Untuk verbose_json:
task
string
Selalu transcribe.
language
string
Bahasa yang terdeteksi.
duration
number
Durasi audio dalam detik.
segments
array
Segmen transkripsi dengan timestamp.
words
array
Timestamp tingkat kata (jika diminta).
curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"
{
  "text": "Hello, this is a test of the transcription API."
}

Terjemahan

Untuk menerjemahkan audio ke bahasa Inggris, gunakan endpoint translations:
response = client.audio.translations.create(
    model="whisper-1",
    file=audio_file
)