Zum Hauptinhalt springen

Überblick

Übersetzt Audio in jeder unterstützten Sprache in englischen Text. Im Gegensatz zur Transkription gibt dieser Endpoint unabhängig von der Eingabesprache immer englischen Text aus.

Request Body

file
file
erforderlich
Die Audio-Datei, die übersetzt werden soll. Unterstützte Formate: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. Die maximale Dateigröße beträgt 25 MB.
model
string
Standard:"whisper-1"
Das zu verwendende Modell. Derzeit wird nur whisper-1 unterstützt.
prompt
string
Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Segment fortzusetzen. Sollte auf Englisch sein.
response_format
string
Standard:"json"
Das Format der Ausgabe. Optionen: json, text, srt, verbose_json, vtt.
temperature
number
Die Sampling-Temperatur zwischen 0 und 1. Höhere Werte wie 0.8 erzeugen zufälligere Ausgaben, während niedrigere Werte wie 0.2 die Ausgabe fokussierter und deterministischer machen.

Antwort

text
string
Der übersetzte Text auf Englisch.
Für das Format verbose_json enthält die Antwort außerdem:
language
string
Die erkannte Sprache des Eingabe-Audios.
duration
number
Die Dauer des Eingabe-Audios in Sekunden.
segments
array
Segmente des übersetzten Textes mit Zeitstempeln.
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Übersetzung vs. Transkription

FunktionÜbersetzungTranskription
AusgabespracheImmer EnglischGleich wie die Eingabe
AnwendungsfallFremdsprachiges Audio in Englisch umwandelnOriginalsprache beibehalten
SprachparameterNicht anwendbarOptionaler Hinweis
Der Übersetzungs-Endpoint erkennt die Ausgangssprache automatisch und übersetzt ins Englische. Der language-Parameter aus der Transkription wird ignoriert.