Resumen
Traduce audio en cualquier idioma compatible a texto en inglés. A diferencia de la transcripción, este endpoint siempre genera texto en inglés, independientemente del idioma de entrada.
Cuerpo de la Solicitud
El archivo de audio a traducir. Formatos compatibles: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. El tamaño máximo de archivo es de 25 MB.
model
string
predeterminado: "whisper-1"
El modelo a utilizar. Actualmente solo se admite whisper-1.
Un texto opcional para guiar el estilo del modelo o continuar un segmento anterior. Debe estar en inglés.
response_format
string
predeterminado: "json"
El formato de la salida. Opciones: json, text, srt, verbose_json, vtt.
La temperatura de muestreo, entre 0 y 1. Valores más altos como 0.8 producen una salida más aleatoria, mientras que valores más bajos como 0.2 hacen que la salida sea más enfocada y determinista.
Respuesta
El texto traducido en inglés.
Para el formato verbose_json, la respuesta también incluye:
El idioma detectado del audio de entrada.
La duración del audio de entrada en segundos.
Segmentos del texto traducido con marcas de tiempo.
cURL
Python
JavaScript
Go
PHP
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
-H "Authorization: Bearer sk-your-api-key" \
-F "file=@german_audio.mp3" \
-F "model=whisper-1"
{
"text" : "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}
Traducción vs Transcripción
Característica Traducción Transcripción Idioma de salida Siempre inglés Igual al de entrada Caso de uso Convertir audio extranjero a inglés Preservar el idioma original Parámetro de idioma No aplicable Sugerencia opcional
El endpoint de traducción detecta automáticamente el idioma de origen y lo traduce al inglés. El parámetro language de la transcripción se ignora.