Transkription erstellen

curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"

{
  "text": "Hello, this is a test of the transcription API."
}

Request Body

file

erforderlich

Audiodatei zur Transkription. Unterstützte Formate: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.

model

string

Standard:"whisper-1"

Zu verwendendes Modell. Derzeit wird nur whisper-1 unterstützt.

language

string

Sprache des Audios im ISO-639-1-Format (z. B. en, zh, ja).

prompt

string

Optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Segment fortzusetzen.

response_format

string

Standard:"json"

Ausgabeformat: json, text, srt, verbose_json, vtt.

temperature

number

Standard:"0"

Sampling-Temperatur (0 bis 1).

timestamp_granularities

array

Granularität der Zeitstempel: word und/oder segment. Erfordert verbose_json.

Response

text

string

Der transkribierte Text.

Für verbose_json:

task

string

Immer transcribe.

language

string

Erkannte Sprache.

duration

number

Audiodauer in Sekunden.

segments

array

Transkriptionssegmente mit Zeitstempeln.

words

array

Zeitstempel auf Wortebene (falls angefordert).

curl -X POST "https://api.lemondata.cc/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"

{
  "text": "Hello, this is a test of the transcription API."
}

Übersetzung

Um Audio ins Englische zu übersetzen, verwenden Sie den translations-Endpunkt:

response = client.audio.translations.create(
    model="whisper-1",
    file=audio_file
)

Sprache erstellen Übersetzung erstellen

Kern

Text & Chat

Dateien & Batch-Jobs

Bilder & Medien

Asynchrone Jobs

Gemini nativ

Verwaltung

Transkription erstellen

Request Body

Response

Übersetzung

Kern

Text & Chat

Dateien & Batch-Jobs

Bilder & Medien

Asynchrone Jobs

Gemini nativ

Verwaltung

​Request Body

​Response

​Übersetzung

Request Body

Response

Übersetzung