Request Body
Audiodatei zum Transkribieren. Unterstützte Formate: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
model
string
Standard:"whisper-1"
Zu verwendendes Modell. Derzeit wird nur whisper-1 unterstützt.
Sprache des Audios im ISO-639-1-Format (z. B. en, zh, ja).
Optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Segment fortzusetzen.
Ausgabeformat: json, text, srt, verbose_json, vtt.
Sampling-Temperatur (0 bis 1).
Zeitstempel-Granularität: word und/oder segment. Erfordert verbose_json.
Response
Für verbose_json:
Transkriptionssegmente mit Zeitstempeln.
Zeitstempel auf Wortebene (falls angefordert).
curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
-H "Authorization: Bearer sk-your-api-key" \
-F file="@audio.mp3" \
-F model="whisper-1" \
-F language="en"
{
"text": "Hello, this is a test of the transcription API."
}
Übersetzung
Um Audio ins Englische zu übersetzen, verwenden Sie den Translations-Endpunkt:
response = client.audio.translations.create(
model="whisper-1",
file=audio_file
)