Saltar al contenido principal
POST
/
v1
/
audio
/
translations
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Resumen

Traduce audio en cualquier idioma compatible a texto en inglés. A diferencia de la transcripción, este endpoint siempre genera texto en inglés, independientemente del idioma de entrada.

Cuerpo de la Solicitud

file
file
requerido
El archivo de audio a traducir. Formatos compatibles: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. El tamaño máximo de archivo es de 25 MB.
model
string
predeterminado:"whisper-1"
El modelo a utilizar. Actualmente solo se admite whisper-1.
prompt
string
Un texto opcional para guiar el estilo del modelo o continuar un segmento anterior. Debe estar en inglés.
response_format
string
predeterminado:"json"
El formato de la salida. Opciones: json, text, srt, verbose_json, vtt.
temperature
number
La temperatura de muestreo, entre 0 y 1. Valores más altos como 0.8 producen una salida más aleatoria, mientras que valores más bajos como 0.2 hacen que la salida sea más enfocada y determinista.

Respuesta

text
string
El texto traducido en inglés.
Para el formato verbose_json, la respuesta también incluye:
language
string
El idioma detectado del audio de entrada.
duration
number
La duración del audio de entrada en segundos.
segments
array
Segmentos del texto traducido con marcas de tiempo.
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Traducción vs Transcripción

CaracterísticaTraducciónTranscripción
Idioma de salidaSiempre inglésIgual al de entrada
Caso de usoConvertir audio extranjero a inglésPreservar el idioma original
Parámetro de idiomaNo aplicableSugerencia opcional
El endpoint de traducción detecta automáticamente el idioma de origen y lo traduce al inglés. El parámetro language de la transcripción se ignora.